Deepseek Larga Language Model

12 小时

DeepSeek，进军车圈！

2月7日，吉利汽车宣布其自研的星睿大模型与DeepSeek-R1已完成深度融合。据悉，融合DeepSeek-R1模型，吉利将对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。

12 小时

吉利汽车接入DeepSeek，AI大模型上车已到加速阶段

18 小时

多模态DeepSeek来了！杨耀东团队联合港科发布Align-DS-V，助力灵初DS-VLA ...

在当前AI领域的快速发展中，“强推理慢思考”已经成为主要的发展动向之一，它们深刻影响着研发方向和投资决策。如何将强推理慢思考进一步推广到更多模态甚至是全模态场景，并且确保和人类的价值意图相一致，已成为一个极具前瞻性且至关重要的挑战。

腾讯网18 小时

漫谈DeepSeek及其背后的核心技术

为了在负载均衡和模型性能之间取得更好的平衡，DeepSeek开创了一种无辅助损失的负载均衡策略：为每个专家引入一个偏差项，并将其添加到相应的亲和力分数中以确定top-K路由，具体来说：如果其对应的专家过载，我们将偏差项减少γ；如果其对应的专家负载不足 ...

See Hua Daily News18 小时

林德宜：美国能阻挡中国AI新星DeepSeek吗？

2025年1月20日，当西方科技巨头齐聚特朗普的总统就职典礼时，一家名不见经传的中国人工智慧（AI）公司——DeepSeek（深度求索)，悄然发布了其R1模型的人工智能开源版本，并附上技术报告及不受限制的商业使用许可证。这不仅仅是普通的AI应用程式。其在多项核心指标上可以OpenAI的Cha ...

21 小时

DeepSeek百万年薪“招兵买马”

After rapidly emerging as a key player in the global artificial intelligence (AI) industry, Chinese AI firm DeepSeek has ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果