deepseek distillation

在采访中，多位业内人士告诉记者，DeepSeek使金融机构或金融科技企业的AI获得成本降低，且在金融各场景中产生积极效果。不过，基于其开源特性，也给机构或企业的数据安全以及合规运营带来新的要求，与此同时，对于自研大模型的机构或企业，研究方向也需要进行一定调整与变化。

17 小时

专访 | 从“爆火”走向“长红”，DeepSeek任重道远

中国AI大模型创业公司DeepSeek（深度求索）正式发布DeepSeek-R1大模型。正式发布之初，DeepSeek便登上苹果App Store中国区免费榜、美区苹果App Store免费榜首位，热度一度超越 ChatGPT ...

十轮网科技资讯 on MSN19 小时

APMIC携手铨锴国际推AI算力方案，支持李飞飞s1训练方法

曾获Google、NVIDIA两大公司资源注资的台湾创业公司APMIC（Accelerate Private Machine Intelligence Company）与铨锴国际，共同推出软硬件集成的Test-Time Compute ...

1 天

DeepSeek“风暴”席卷A股：软件企业忙接入，国产算力迎机遇

随着DeepSeek热度飙升，从云服务巨头到本土芯片厂商、AI应用企业等，众多企业纷纷加入其“朋友圈”。阿里云、百度智能云、华为云、腾讯云等国内云巨头相继接入。多家本土芯片厂商如摩尔线程、海光信息等也纷纷响应，宣布支持DeepSeek模型。安恒信息、 ...

腾讯网2 天

爆火的DeepSeek遭遇成本、技术质疑，未来算力还重要吗？

近期，DeepSeek在AI大模型领域引发热议，凭借其惊人的性能表现和低成本训练模式，迅速吸引了全球关注，且热度一直不减。但随之而来的，对其成本、技术以及为未来作为大模型基础设施的算力也引发了争议。

2 天

DeepSeek，中国AI的“斯普特尼克时刻”？

“斯普特尼克时刻”是指某一国家或地区在某个领域的突然突破，带来巨大的技术、经济或政治影响，通常促使全球或其他国家重新评估自己的发展方向和竞争力。这个词源于1957年苏联发射的第一颗人造卫星——斯普特尼克1号（Sputnik ...

2 天

DeepSeek的华丽文风是怎样炼成的？

DeepSeek的内容生成优势之一，在于构建了一个比较独特的文学增强型数据生态，即把自然语言生成转化成一个可控的风格系统，从而使得可以把文学创作领域的专业评价体系转化成相对应的函数，进而构建起一个风格表征的数学建模。

Nanyang Siang Pau4 天

车价明年大涨? 财政部:报道不实

综合澎湃新闻、第一财经和观察者网报道，吉利汽车星期五（2月7日）宣布，其自研大模型星睿车控与DeepSeek已完成深度融合，将能为用户主动提供车辆控制、主动对话、售后等服务。

7 天

AI基建需求续成长，DeepSeek崛起凸显产业将更注重高成本效益

AI 行业过去依赖扩大模型、增加数据和提升硬件效能来发展，但成本与效率成为挑战。DeepSeek 采用蒸馏模型（Model Distillation）技术，压缩大型模型以提升推理速度并降低硬件需求，同时充分发挥 NVIDIA Hopper 降规版芯片的效益，最大化运算资源利用。其成本优势来自高效能硬件选择、新型蒸馏技术及 API 开源策略，不仅优化技术与商业应用的平衡，也展现 AI ...

腾讯网7 天

李飞飞团队50美元复刻DeepSeek？其实是基于通义监督微调，我们研究了 ...

继DeepSeek掀起轩然大波之后，AI圈这两天再次被“震惊”。近日有媒体报道称，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的 ...

See Hua Daily News8 天

林德宜：美国能阻挡中国AI新星DeepSeek吗？

2025年1月20日，当西方科技巨头齐聚特朗普的总统就职典礼时，一家名不见经传的中国人工智慧（AI）公司——DeepSeek（深度求索)，悄然发布了其R1模型的人工智能开源版本，并附上技术报告及不受限制的商业使用许可证。这不仅仅是普通的AI应用程式。其在多项核心指标上可以OpenAI的Cha ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果