Deepseek Larga Language Model

2025年这个春节，DeepSeek一举改写了全球AGI大叙事。在万般热闹之际，我们特别想沉下来做一些基础科普工作。在《商业访谈录》89集节目中，我邀请了加州大学伯克利分校人工智能实验室在读博士生潘家怡，为大家对照解读了春节前的DeepSeek-R1 ...

3 小时

有道智云全面接入 DeepSeek，提升多领域服务能

近日，有道智云宣布全面接入DeepSeek。开发者可以直接在平台调用DeepSeek大模型能力打造AI智能体，结合不同业务场景，为用户打造智能助手。DeepSeek与网易有道自研的子曰教育大模型融合，进一步提升了自然语言翻译、 ...

2 天

AI新势力崛起：欧洲Mistral与Deepseek能否撼动ChatGPT的霸主地位？

在当前市场上，ChatGPT始终占据领先地位，以其出色的准确性和速度而受到用户的青睐。其优化的算法和基础设施不仅保证了及时的响应，同时也进行了多方面的资源利用优化，以降低运营成本。然而，来自中国的Deepseek，则在数学问题和编码任务的推理能力上展现出非凡实力。其Deepseek-R1在MATH-500基准测试中以97.3%的高分展现出卓越的能力，令其成为AI领域的一颗璀璨新星。而Mistral ...

1 天

冲击美股！DeepSeek崛起引发科技股巨震，英伟达股价暴跌

2025年1月底，一则来自中国的消息震动了美股市场：新兴的人工智能公司DeepSeek（深度求索）通过其最新发布的AI模型，引发了美国科技股的剧烈动荡。作为一家成立仅两年，并迅速崛起的创业公司，DeepSeek的发展势头不可小觑。其推出的尖端技术不仅影响了市场情绪，更撼动了像英伟达（NVIDIA）这样的行业巨头，使其股价在短短一天内暴跌近17%，市值蒸发接近6000亿美元，创下了美国股市历史上的单 ...

5 天

DeepSeek，进军车圈！

2月7日，吉利汽车宣布其自研的星睿大模型与DeepSeek-R1已完成深度融合。据悉，融合DeepSeek-R1模型，吉利将对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。

腾讯网21 小时

对话圈内人：DeepSeek爆火，对AI游戏意味着什么？

最近，DeepSeek 以低成本却能媲美 GPT-4o 的性能，无疑又激起了新一轮的 AI 风潮，成为行业内外关注的焦点。对游戏领域来说，DeepSeek的出现意味着什么？答案恐怕依旧是降低成本。正在开发3D AI乙游《如意情探》的Jaz告诉茶馆：“DeepSeek现在的调用成本大概是我们之前使用模型成本的1/20。”在 ...

5 天

吉利汽车接入DeepSeek，AI大模型上车已到加速阶段

51CTO4 天

图解系列｜DeepSeek-R1的出众推理能力因何而来？

通过上述内容，相信你现在应该对 DeepSeek-R1 模型有了基本的理解。如果你觉得需要更多基础知识来理解这篇文章，我建议你获取一本《Hands-On Large Language Models》 [6] 或者在线在 O’Reilly [7] 上阅读，并在 Github [8] 上查看相关内容。使用Ollama运行AI大模型，再通过 ...

智能制造网1 天

爆火的DeepSeek引发成本、技术质疑，未来算力还重要吗？

近期，DeepSeek在AI大模型领域引发热议，凭借其惊人的性能表现和低成本训练模式，迅速吸引了全球关注，且热度一直不减。但随之而来的，对其成本、技术以及为未来作为大模型基础设施的算力也引发了争议。

2 天

Sebastian Raschka：关于DeepSeek R1和推理模型，我有几点看法

著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次，他将立足于 DeepSeek 技术报告，介绍用于构建推理模型的四种主要方法，也就是如何通过推理能力来增强 LLM。Sebastian Raschka 表示：「我希望这能提供有价值的见解，并帮助你了解围绕这一主题的快速演变的文献和话题炒作。」 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果