Deepseek Larga Language Model

10 小时

DeepSeek，进军车圈！

2月7日，吉利汽车宣布其自研的星睿大模型与DeepSeek-R1已完成深度融合。据悉，融合DeepSeek-R1模型，吉利将对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。

10 小时

吉利汽车接入DeepSeek，AI大模型上车已到加速阶段

15 小时

多模态DeepSeek来了！杨耀东团队联合港科发布Align-DS-V，助力灵初DS-VLA ...

在当前AI领域的快速发展中，“强推理慢思考”已经成为主要的发展动向之一，它们深刻影响着研发方向和投资决策。如何将强推理慢思考进一步推广到更多模态甚至是全模态场景，并且确保和人类的价值意图相一致，已成为一个极具前瞻性且至关重要的挑战。

腾讯网16 小时

漫谈DeepSeek及其背后的核心技术

为了在负载均衡和模型性能之间取得更好的平衡，DeepSeek开创了一种无辅助损失的负载均衡策略：为每个专家引入一个偏差项，并将其添加到相应的亲和力分数中以确定top-K路由，具体来说：如果其对应的专家过载，我们将偏差项减少γ；如果其对应的专家负载不足 ...

See Hua Daily News16 小时

林德宜：美国能阻挡中国AI新星DeepSeek吗？

2025年1月20日，当西方科技巨头齐聚特朗普的总统就职典礼时，一家名不见经传的中国人工智慧（AI）公司——DeepSeek（深度求索)，悄然发布了其R1模型的人工智能开源版本，并附上技术报告及不受限制的商业使用许可证。这不仅仅是普通的AI应用程式。其在多项核心指标上可以OpenAI的Cha ...

腾讯网1 天

多模态DeepSeek来了：北大港科联合发布Align-DS-V

本文系Align-DS-V团队投稿内容导读：在当前AI领域的快速发展中，“强推理慢思考”已经成为主要的发展动向之一，它们深刻影响着研发方向和投资决策。如何将强推理慢思考进一步推广到更多模态甚至是全模态场景，并且确保和人类的价值意图相一致，已成为一个极 ...

2 天

绕过英伟达CUDA框架！DeepSeek或将兼容国产GPU，迎接AI技术新纪元

近年来，人工智能技术发展迅猛，尤其在大语言模型（Large Language Models, LLMs）领域，各大公司纷纷角逐。近日，外媒Tom’s Hardware报道，DeepSeek公司在其最新研发的大语言模型中，成功绕过了英伟达的CUDA框架 ...

3 天

DeepSeek是否真的帶來低成本AI革命？未必！｜關稅因素已經被消化？蛇 ...

【The relationship between ontology and large language models (LLMs) is significant, as ontologies provide a structured framework that enhances the understanding and processing of knowledge within LLMs ...

4 天

MIT科技评论：DeepSeek 如何撕毁 AI 剧本

上周，中国公司 DeepSeek 发布了一款名为 R1 的大型语言模型，震惊了美国科技行业。R1 不仅能与本土竞争对手相媲美，而且成本仅为其一小部分，而且免费提供。美国股市因此损失了 1 ...

腾讯网15 天

追平多模态满血o1，kimi的新模型k1.5 破解了OpenAI的秘密？

作者｜周一笑邮箱｜[email protected]年关将至，大模型行业又热闹了起来。一天之内，两个“对标”o1的国产大模型相继发布，分别是DeepSeek的DeepSeek ...

36氪21 天

“百模乱世”出枭雄，Deepseek何以一鸣惊人？

Deepseek V3创新低成本AI模型，助力行业发展。从最初对算力的盲目崇拜，到如今深挖算法架构与数据质量，配合成熟商业模式的思考，背后逻辑也正 ...

雷锋网21 天

大模型隐藏玩家上桌：DeepSeek 向左，面壁向右

还提出了新型类脑高效稀疏 Configurable Foundation Model 架构；其次，DeepSeek 的高效是高度定制的技术体系，MoE 和 MLA 强绑定，并且主要面向大集群训练 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果