Deepseak Architecture

11 天

也就是说 DeepSeek 在研发大模型时绕过了 CUDA。CUDA（Compute Unified Device ...

7 天

DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注，其日活用户数在短时间内突破2000万，成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业，外部算力（主要是GPU）限制逐渐成为制约其进一步发展的瓶颈，如今他们正致力于通过优 ...

7 天

曝DeepSeek绕过CUDA！为适配中国国产GPU做准备跳出英伟达限制

而PTX在接近汇编语言的层级运行，允许进行细粒度的优化，如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护，所以行业通用的做法是使用CUDA这样的高级编程语言。

7 天

绕过英伟达CUDA框架！DeepSeek或将兼容国产GPU，迎接AI技术新纪元

近年来，人工智能技术发展迅猛，尤其在大语言模型（Large Language Models, LLMs）领域，各大公司纷纷角逐。近日，外媒Tom’s Hardware报道，DeepSeek公司在其最新研发的大语言模型中，成功绕过了英伟达的CUDA框架 ...

2 天

我们应如何看待DeepSeek的557.6万美元训练成本？

简单来说，DeepSeek-V3仅使用了2048块英伟达H800 GPU，耗费了557.6万美元就完成了训练，相比同等规模的模型（如GPT-4、GPT-4o、Llama 3.1），训练成本大幅降低。

7 天on MSN

华为与DeepSeek联手会发生什么：算力已达英伟达60%、CANN取代CDUA架构

快科技2月5日消息，华为（昇腾+CANN）+Deepseek，能解决英伟达GPU+CUDA的“卡脖子”吗？据tomshardware等多家媒体报道，华为最新的AI处理器昇腾910C（Ascend 910C）的推理性能已达N ...

星島網9 天

DeepSeek︱传为改用国产GPU做准备跳出NVIDIA限制

内地AI新创公司深度求索（DeepSeek），开发的大语言模型时，绕过美国人工智能巨头辉达（NVIDIA）的CUDA框架，有内媒报道，DeepSeek正为未来适配国产GPU晶片做准备。

美国之音3 天

DeepSeek跌落神坛？多个机构质疑其安全性，多个国家禁用

中国初创公司深度求索推出的DeepSeek应用程序自问世以来，以其号称的低成本、且具备先进推理能力而受到全世界的关注。不过，越来越多的研究 ...

腾讯网8 天

解构DeepSeek-R1：一场AI效率革命背后的技术突破

科技圈从来不缺新闻，但 DeepSeek-R1 的出现，却像一颗石子投入平静的湖面，激起了层层涟漪。这家来自中国的 AI 初创公司，以其开源的推理大模型 R1，正在搅动全球 AI 格局。R1 不仅拥有媲美甚至超越 OpenAI o1 的性能，更以其低廉的成本和开放的姿态，赢得了全世界的关注。DeepSeek-R1 的出现，如同 AI ...

sinchew9 天

DeepSeek或绕开辉达适配中国产GPU

（北京3日综合电）中国媒体周一引述消息报道，中国初创企业深度求索（DeepSeek）研发大语言模型时据报绕过了美国人工智能巨头辉达的 CUDA 框架，为其在未来适配中国国产晶片做好准备。由辉达开发的软硬体整合技术“统一计算架构”（Compute ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果