Deepseek V2 Model - 搜索 News

智东西 on MSN9 小时

创历史！DeepSeek获16大国产AI芯片力挺，中国智算的半壁江山都出动了

目前，DeepSeek的全量模型已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署。这一成果标志着燧原科技在国内率先实现了DeepSeek全量模型的部署和落地。燧原科技与并济科技 ...

腾讯网9 小时

DeepSeek获16大国产AI芯片力挺，中国智算的半壁江山都出动了

天翼云、联通云、移动云三大运营商云均已采用昇腾算力底座来支持DeepSeek模型。神州数码也特别提到其神州鲲泰推理服务器产品搭载昇腾硬件，可全面支持DeepSeek模型的快速部署。

14 小时

美国下黑手！DeepSeek遇上大麻烦，梁文锋一人狂斗全美AI界

白宫人工智能和加密货币事务负责人大卫·萨克斯表示，人工智能中有一种叫“蒸馏”的技术，它指的是一个模型从另一个模型中学习的过程。他认为，在接下来的几个月里，美国领先的人工智能公司将采取措施，试图防止“蒸馏”。

8 小时

字节跳动将上线全新多模态视频生成模型

2月7日，记者了解到，字节跳动旗下一站式AI创作平台即梦AI将上线多模态视频生成模型OmniHuman，仅需一张图片与一段音频便可生成一条AI视频，该模型为字节自研闭源模型。即梦AI相关负责人透露，该模型未来会进行小范围内测，官方也会对这一功能设置严格的安全审核机制，并对输出的视频标注水印以作提醒。（第一财经记者吕倩） ...

腾讯网5 小时

23家本土IT企业宣布接入DeepSeek

DoNews2月7日消息，据ITPUB报道，2025年春节期间，中国AI初创公司深度求索（DeepSeek）凭借开源模型DeepSeek-R1和V3系列，以“3%成本对标OpenAI”的技术突破火速出圈，将中国人工智能产业推向全球科技界的聚光灯下。随着DeepSeek热度飙升，其“朋友圈”也在快速扩容。从云服务提供商到芯片制造商，再到网络安全公司，各大厂 ...

15 小时

DeepSeek 引爆全球！国内多家企业官宣基于昇腾上线DeepSeek

2025年一月以来，由DeepSeek团队开发的系列模型，如拥有6710亿参数的大型语言模型DeepSeek-R1等，一经发布便在全球范围内引发热议，其先进的架构和卓越的性能吸引了众多开发者与科技企业的目光。国内外众多企业争先上线DeepSeek系列大模型，而昇腾凭借强大的算力支持与技术协同能力，让DeepSeek的上线进程按下“快进键”，以令人惊叹的中国速度，实现了技术与应用的高效对接。

16 小时

中信建投：国内物联网模组厂商在端侧AI领域具备先发优势

中信建投研报称，1）DeepSeek在保持模型优异性能指标的同时大幅降低训练和推理成本。DeepSeek-V3使用2048块H800GPU完成了6710亿参数的训练，训练成本为557.6万美元，DeepSeek-R1模型的每百万输出tokens为16元，均显著低于同等水平的模型成本。利用DeepSeek模型生成的数据样本实现小参数量的模型蒸馏，提升模型性能。2）高性能、轻量化、低成本的模型能力将显 ...