131,072 - 搜索 News

12 天

阿里开源全新推理模型QwQ-32B，一台Mac就能实现顶级推理能力

3 月 6 日，阿里巴巴旗下的 Qwen 团队用一条题为《QwQ-32B：拥抱强化学习的力量》的博文公布了全新的开源大型推理模型 QwQ-32B（Qwen-with-Questions），这款仅有 320 ...

8 天

部署DeepSeek-R1全参数模型，云彣48GB大容量存储方案成关键

自DeepSeek-R1发布以来,便在业界引起了广泛关注。其不仅集成了前沿的“思维链”技术,在处理复杂任务时展现出非凡的推理能力,而且还通过算法优化显著降低了本地部署的成本。尽管如此,具备完整671B参数规模的DeepSeek ...

腾讯网11 天

Alibaba 新开源模型 QwQ-32B：以更小算力匹敌 DeepSeek-R1

Qwen 团队是中国电商巨头阿里巴巴的一个部门，专注于开发其不断扩展的开源 Qwen 大语言模型（LLM）系列。该团队推出了 QwQ-32B，这是一种新的 320 亿参数推理模型，旨在通过强化学习（RL）提高复杂问题解决任务的性能。

8 天

揭秘DeepSeek-R1：48GB存储如何突破本地部署限制

自DeepSeek-R1发布以来，业界对其强大的功能及技术革新表现出极大的关注。这款人工智能模型不仅集成前沿的“思维链”技术，展现出非凡的推理能力，同时通过独特的算法优化显著降低了本地部署成本。在当前激烈的市场竞争环境中，这一突破无疑使得AI技术的应用更加普遍和经济，从而满足了企业及个人日渐增长的需求。

腾讯网8 天

从零开始的DeepSeek微调训练实战（SFT）

前言本文重点介绍使用微调框架unsloth，围绕DeepSeek R1 Distill 7B模型进行高效微调，并介绍用于推理大模型高效微调的COT数据集的创建和使用方法，并在一个medical-o1-reasoning-SFT数据集上完成高效微调实战 ...

来自MSN13 天

阿里32B新模型比肩满血DeepSeek-R1！苹果Mac本地可跑，网友已玩疯

智东西（公众号：zhidxcom）作者 | 程茜编辑 | 云鹏智东西3月6日报道，今日凌晨，阿里云发布最新推理模型QwQ-32B，性能媲美DeepSeek-R1，在消费级显卡上也能实现本地部署。

财富中文网3 天

[中国上市公司500强] 2023年第154位：华润电力控股有限公司

公司是华润(集团)有限公司(「华润集团」)的旗舰附属公司，主要在中国较富裕或资源丰富的地区投资、开发、经营和管理发电厂、煤矿及新能源项目。公司按照市场与资源并重的原则，聚焦“三个三角区，三条沿线”(京津唐、长江三角洲和珠江三角洲地区 ...

IT之家7 天

部署 DeepSeek-R1 全参数模型，云彣 48GB 大容量存储方案成关键

而如果有长文本对话需求的用户, 则可以使用非满血的 70B 蒸馏模型。在最大 131072 上下文长度条件下, 云彣 (UniWhen)「珑」系列 DDR5 192GB 套条依然能够完整加载模型, 并高效完成运算百万字数级别小说所需的数据处理任务。其内存使用降至 90GB, 占用率则为 47%。

GitHub9 天

模型部署不求人！从TTFT到Throughput的性能估算终极公式.md

如果你也在这波DeepSeek R1私有化部署的浪潮里，你的老板可能会让你预估下部署一个XX版本的模型需要什么样的硬件资源，TPS是多少。为此，你也许会上网搜索各种测试，你可能会看到这样的图：这些测评基本上都是机构或者网友基于自己的机器测出来的值，有 ...

搜狐20 天

Oracle荣登2025年全球公有云基础设施领导者，云计算未来的新篇章

通过OCI，Oracle在AI基础设施及云技术上不断进行重大的投资，其中OCISupercluster支持多达131,072个NVIDIA GPU，这也为用户带来了革新的云体验。这一报告 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果