Deepseek Larga Language Model

7 天

近年来，人工智能技术发展迅猛，尤其在大语言模型（Large Language Models, LLMs）领域，各大公司纷纷角逐。近日，外媒Tom’s Hardware报道，DeepSeek公司在其最新研发的大语言模型中，成功绕过了英伟达的CUDA框架 ...

腾讯网1 天

逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”

2025年这个春节，DeepSeek一举改写了全球AGI大叙事。在万般热闹之际，我们特别想沉下来做一些基础科普工作。在《商业访谈录》89集节目中，我邀请了加州大学伯克利分校人工智能实验室在读博士生潘家怡，为大家对照解读了春节前的DeepSeek-R1 ...

2 天

AI新势力崛起：欧洲Mistral与Deepseek能否撼动ChatGPT的霸主地位？

在当前市场上，ChatGPT始终占据领先地位，以其出色的准确性和速度而受到用户的青睐。其优化的算法和基础设施不仅保证了及时的响应，同时也进行了多方面的资源利用优化，以降低运营成本。然而，来自中国的Deepseek，则在数学问题和编码任务的推理能力上展现出非凡实力。其Deepseek-R1在MATH-500基准测试中以97.3%的高分展现出卓越的能力，令其成为AI领域的一颗璀璨新星。而Mistral ...

2 天

Sebastian Raschka：关于DeepSeek R1和推理模型，我有几点看法

著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次，他将立足于 DeepSeek 技术报告，介绍用于构建推理模型的四种主要方法，也就是如何通过推理能力来增强 LLM。Sebastian Raschka 表示：「我希望这能提供有价值的见解，并帮助你了解围绕这一主题的快速演变的文献和话题炒作。」 ...

3 小时

有道智云全面接入 DeepSeek，提升多领域服务能

近日，有道智云宣布全面接入DeepSeek。开发者可以直接在平台调用DeepSeek大模型能力打造AI智能体，结合不同业务场景，为用户打造智能助手。DeepSeek与网易有道自研的子曰教育大模型融合，进一步提升了自然语言翻译、 ...

腾讯网21 小时

对话圈内人：DeepSeek爆火，对AI游戏意味着什么？

最近，DeepSeek 以低成本却能媲美 GPT-4o 的性能，无疑又激起了新一轮的 AI 风潮，成为行业内外关注的焦点。对游戏领域来说，DeepSeek的出现意味着什么？答案恐怕依旧是降低成本。正在开发3D AI乙游《如意情探》的Jaz告诉茶馆：“DeepSeek现在的调用成本大概是我们之前使用模型成本的1/20。”在 ...

16 天

开源界的新“王者”诞生？AI“黑马”DeepSeek登顶美区苹果

DeepSeek-R1的发布不仅是中国AI技术自主创新的里程碑，更以开源和低成本策略推动全球AI生态向开放、高效方向演进。周鸿祎也公开表示，“中国大模型技术复仇者联盟”已悄然成型，DeepSeek正成为对抗技术霸权的关键力量。

来自MSN1 天

Deepseek妙语连珠，是否触达了人类语言的根源？

本文将带你穿梭于fMRI实验室与云计算中心之间，解码语言处理的双生密码，见证智能本质的百年追问如何在硅基与碳基的共鸣中找到新的答案。

新浪网4 天

DeepSeek，进军车圈！

宝马集团则是选择基于亚马逊Alexa大语言模型（LLM，Large Language Model），打造全新一代BMW智能个人助理，提供生成式人工智能技术。 DeepSeek的爆火无疑 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果