Deepseak Architecture

5 小时

我们应如何看待DeepSeek的557.6万美元训练成本？

简单来说，DeepSeek-V3仅使用了2048块英伟达H800 GPU，耗费了557.6万美元就完成了训练，相比同等规模的模型（如GPT-4、GPT-4o、Llama 3.1），训练成本大幅降低。

1 天

DeepSeek积极适配国产GPU，绕开英伟达CUDA

DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注，其日活用户数在短时间内突破2000万，成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业，外部算力 ...

腾讯网1 天

DeepSeek绕过CUDA！为适配中国国产GPU做准备

2月5日消息，DeepSeek全球爆火，再一次引发外界对GPU算力限制话题的关注。据报道，DeepSeek开发的大语言模型绕过了英伟达的CUDA框架，正为未来兼容国产GPU芯片做准备。众所周知，英伟达的CUDA（Compute Unified ...

1 天

曝DeepSeek绕过CUDA！为适配中国国产GPU做准备跳出英伟达限制

这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。

2 天on MSN

华为与DeepSeek联手会发生什么：算力已达英伟达60%、CANN取代CDUA架构

快科技2月5日消息，华为（昇腾+CANN）+Deepseek，能解决英伟达GPU+CUDA的“卡脖子”吗？据tomshardware等多家媒体报道，华为最新的AI处理器昇腾910C（Ascend 910C）的推理性能已达NVIDIA H100 ...

2 天

绕过英伟达CUDA框架！DeepSeek或将兼容国产GPU，迎接AI技术新纪元

近年来，人工智能技术发展迅猛，尤其在大语言模型（Large Language Models, LLMs）领域，各大公司纷纷角逐。近日，外媒Tom’s Hardware报道，DeepSeek公司在其最新研发的大语言模型中，成功绕过了英伟达的CUDA框架 ...

2 天

DeepSeek积极筹备适配国产GPU，绕开英伟达CUDA

DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注，其日活用户数在短时间内突破2000万，成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业，外部算力（主要是GPU）限制逐渐成为制约其进一步发展的瓶颈，如今他们正致力于通过优 ...

来自MSN2 天

DeepSeek 绕开 CUDA 垄断，针对英伟达 PTX 进行优化实现最大性能，英伟 ...

这个内容已经在X上讨论过了，很火热的问题我先翻译一下国外教授的详细回答，再讲清楚CUDA、PTX的关系。中文翻译：人们说“Deepseek 使用了 PTX，它打破了 CUDA 的护城河！”从根本上误解了这里发生的事情，以及 CUDA ...

See Hua Daily News3 天

DeepSeek传为改用中国国产GPU做准备

（北京4日讯）中国AI新创公司“深度求索”（DeepSeek）开发的大语言模型绕过美国人工智慧巨头英伟达（Nvidia）的CUDA框架，据报导，DeepSeek正为未来适配中国国产GPU晶片做准备。香港星岛日报网引述中媒报导，英伟达的“统一运算架构”（Compute Unified Devi ...

orientaldaily3 天

DeepSeek传为改用中国国产GPU做准备跳出英伟达限制

（北京4日讯）中国AI新创公司“深度求索”（DeepSeek）开发的大语言模型绕过美国人工智慧巨头英伟达（Nvidia）的CUDA框架，据报导，DeepSeek正为未来适配中国国产GPU晶片做准备。香港星岛日报网引述中媒报导，英伟达的“统一运算架构”（Compute Unified Device Architecture，CUDA）能大幅降低研发大模型的难度，获全球开发商使用，让英伟达在人工智慧（ ...

Lianhe Zaobao4 天

DeepSeek据报绕开英伟达编程框架适配中国国产GPU

据美国科技网站“Tom's ...

腾讯网4 天

解构DeepSeek-R1：一场AI效率革命背后的技术突破

科技圈从来不缺新闻，但 DeepSeek-R1 的出现，却像一颗石子投入平静的湖面，激起了层层涟漪。这家来自中国的 AI 初创公司，以其开源的推理大模型 R1，正在搅动全球 AI 格局。R1 不仅拥有媲美甚至超越 OpenAI o1 的性能，更以其低廉的成本和开放的姿态，赢得了全世界的关注。DeepSeek-R1 的出现，如同 AI ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果