Deepseek Larga Language Model

2025年这个春节，DeepSeek一举改写了全球AGI大叙事。在万般热闹之际，我们特别想沉下来做一些基础科普工作。在《商业访谈录》89集节目中，我邀请了加州大学伯克利分校人工智能实验室在读博士生潘家怡，为大家对照解读了春节前的DeepSeek-R1 ...

2 小时

有道智云全面接入 DeepSeek，提升多领域服务能

近日，有道智云宣布全面接入DeepSeek。开发者可以直接在平台调用DeepSeek大模型能力打造AI智能体，结合不同业务场景，为用户打造智能助手。DeepSeek与网易有道自研的子曰教育大模型融合，进一步提升了自然语言翻译、 ...

9 天

MIT科技评论：DeepSeek 如何撕毁 AI 剧本

上周，中国公司 DeepSeek 发布了一款名为 R1 的大型语言模型，震惊了美国科技行业。R1 不仅能与本土竞争对手相媲美，而且成本仅为其一小部分，而且免费提供。美国股市因此损失了 1 ...

2 天

AI新势力崛起：欧洲Mistral与Deepseek能否撼动ChatGPT的霸主地位？

在当前市场上，ChatGPT始终占据领先地位，以其出色的准确性和速度而受到用户的青睐。其优化的算法和基础设施不仅保证了及时的响应，同时也进行了多方面的资源利用优化，以降低运营成本。然而，来自中国的Deepseek，则在数学问题和编码任务的推理能力上展现出非凡实力。其Deepseek-R1在MATH-500基准测试中以97.3%的高分展现出卓越的能力，令其成为AI领域的一颗璀璨新星。而Mistral ...

腾讯网21 小时

对话圈内人：DeepSeek爆火，对AI游戏意味着什么？

最近，DeepSeek 以低成本却能媲美 GPT-4o 的性能，无疑又激起了新一轮的 AI 风潮，成为行业内外关注的焦点。对游戏领域来说，DeepSeek的出现意味着什么？答案恐怕依旧是降低成本。正在开发3D AI乙游《如意情探》的Jaz告诉茶馆：“DeepSeek现在的调用成本大概是我们之前使用模型成本的1/20。”在 ...

5 天

吉利汽车接入DeepSeek，AI大模型上车已到加速阶段

2月7日，吉利汽车宣布其自研的星睿大模型与DeepSeek-R1已完成深度融合。据悉，融合DeepSeek-R1模型，吉利将对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。

GitHub7 天

KnowledgeDistillation-In-DeepSeek-R1.md

近年来，大型语言模型（Large Language Models, LLMs）的发展取得了长足进步 ... 受到越来越多的关注。本文基于DeepSeek R1 模型的论文，对其蒸馏方法进行深入解析。蒸馏的基本概念 **知识蒸馏（Knowledge Distillation）**这一概念最早由机器学习领域的权威学者 Geoffrey ...

51CTO4 天

图解系列｜DeepSeek-R1的出众推理能力因何而来？

通过上述内容，相信你现在应该对 DeepSeek-R1 模型有了基本的理解。如果你觉得需要更多基础知识来理解这篇文章，我建议你获取一本《Hands-On Large Language Models》 [6] 或者在线在 O’Reilly [7] 上阅读，并在 Github [8] 上查看相关内容。使用Ollama运行AI大模型，再通过 ...

16 天

开源界的新“王者”诞生？AI“黑马”DeepSeek登顶美区苹果

DeepSeek-R1的发布不仅是中国AI技术自主创新的里程碑，更以开源和低成本策略推动全球AI生态向开放、高效方向演进。周鸿祎也公开表示，“中国大模型技术复仇者联盟”已悄然成型，DeepSeek正成为对抗技术霸权的关键力量。

智能制造网1 天

爆火的DeepSeek引发成本、技术质疑，未来算力还重要吗？

近期，DeepSeek在AI大模型领域引发热议，凭借其惊人的性能表现和低成本训练模式，迅速吸引了全球关注，且热度一直不减。但随之而来的，对其成本、技术以及为未来作为大模型基础设施的算力也引发了争议。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果