cuda - 搜索 News

1 天

官方承认系统「作弊」，世界首个「AI CUDA工程师」翻车？o3-mini 11秒 ...

【新智元导读】高调亮相的世界首个「AI CUDA工程师」，宣称能让模型训练速度飙升100倍，如今却上演了一场「作弊」闹剧。OpenAI研究员用o3-mini，11秒便发现了内核代码有bug！

2 天

DeepSeek并没有完全跳出英伟达的CUDA框架，而是选择绕过了CUDA的高层API，直接操作PTX指令集，进行更细粒度的硬件优化。这种做法本质上是在原有框架内寻求突破，而非彻底脱离英伟达的生态系统。为什么选择PTX？这到底是突破，还是妥协？为什么 ...

1 天

揭开「AI CUDA工程师」神话：千亿融资背后的作弊真相与反思

近年来，人工智能（AI）领域的发展迅速，各种新技术层出不穷，其中自动化模型训练的工具尤其引人注目。最近，由SakanaAI推出的被称为「AI ...

5 天

世界首个「AI CUDA工程师」诞生！AI自己写代码优化CUDA内核，性能狂飙 ...

Transformer论文八位作者之一Llion Jones创立的Sakana AI发布重磅成果——全球首个「AI CUDA工程师」！它能将PyTorch代码自动转换为高度优化的CUDA内核，速度比PyTorch原生实现快10-100倍。

腾讯网4 天

英伟达的CUDA，DeepSeek只“击穿”了50%

最近，关于DeepSeek是否能够绕开英伟达的CUDA框架的讨论，引发了广泛关注。这个问题的答案，不仅关乎DeepSeek的未来发展，更可能影响中国GPU产业能否在全球AI竞争中占有一席之地。英伟达的CUDA技术几乎垄断了全球的AI计算市场，国产GP ...

腾讯网4 天

全球首个AI CUDA工程师来了！将PyTorch原生实现提速10-100倍

他们开发的「AI CUDA 工程师」是这一理念的具体实践。「AI CUDA 工程师」是第一个用于全自动 CUDA 内核发现和优化的综合智能体框架。这种方法不仅 ...

来自MSN2 天

全球首个AI CUDA工程师来了！将PyTorch原生实现提速10-100倍

在当今的科技世界里，人工智能（AI）技术已经成为推动各行各业变革的重要力量。然而，随着AI在计算能力和应用领域上的快速增长，大家开始逐渐意识到一个问题：现有的AI系统需要消耗大量的电力和计算资源，这样的模式是否能持续？

3 天

英伟达 RTX 50 系列 GPU 放弃对 32 位 CUDA 支持，老显卡成 PhysX 游戏 ...

PhysX 技术在 64 位应用中仍然可以正常使用，例如在《蝙蝠侠：阿卡姆骑士》中，这表明英伟达并未完全放弃 PhysX 技术。但该公司确实已经停止了 RTX 50 系列显卡对 32 位 CUDA 的支持，未来可能还会进一步扩展这一决定。由于 ...

知乎 on MSN11 天

DeepSeek绕开CUDA垄断，V3论文细节再挖出！英伟达护城河不存在了？

编辑：桃子好困【新智元导读】DeepSeek模型开发竟绕过了CUDA？最新爆料称，DeepSeek团队走了一条不寻常的路——针对英伟达GPU低级汇编语言PTX进行优化实现最大性能。业界人士纷纷表示，CUDA护城河不存在了？原本DeepSeek低成本训出的R1，就已经让整个硅谷和华尔街为之虎躯一震。

21 天

曝DeepSeek绕过CUDA！为适配中国国产GPU做准备跳出英伟达限制

而PTX在接近汇编语言的层级运行，允许进行细粒度的优化，如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护，所以行业通用的做法是使用CUDA这样的高级编程语言。 “这凸显了DeepSeek非凡的工程水平，并表明美国对华制裁加剧的“GPU短缺危机”激发了他们紧迫感和创造力。”韩国Mirae Asset Securities Research的一名分析师表示。

来自MSN12 天

Deepseek打破CUDA算力垄断，嘉合劲威发力AI，全力MRDIMM内存研发

过往运算基本上就是CPU一言堂，那时的霸主是Intel；挖矿初期，AMD的GCN小核心架构成为时代红利，后续nVidia的CUDA架构不断更新，从而成为了从挖矿、专业应用，以及AI运算都成为了霸主。而Deepseek的出现打破了CUDA算力垄断。

36氪27 天

“DeepSeek甚至绕过了CUDA”，工程师灵魂提问：英伟达护城河还在吗？

硬件媒体Tom‘s Hardware带来开年最新热议： DeepSeek甚至绕过了CUDA，使用更底层的编程语言做优化。这一次是DeepSeek-V3论文中的更多细节，被人挖掘出来。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果