并表明美国对华制裁加剧的“GPU短缺危机”激发了他们紧迫感和创造力。”韩国Mirae Asset Securities Research的一名分析师表示。
各路业内人士从不同角度分析 DeepSeek 的模型和技术。 韩国 Mirae Asset Securities Research 的一名分析师在 X 撰写长文分析称,这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程实现的,而非通过 CUDA 中的某些功能。CUDA 是由英伟达开发的一种通用编程 ...
英伟达刚刚从 DeepSeek-R1 引发的 4 万亿元暴跌中缓过劲来,又面临新的压力? 硬件媒体 Tom's Hardware 带来开年最新热议:DeepSeek 甚至绕过了 CUDA,使用 ...
另外,据@Jukanlosreve引用的Mirae Asset Securities Korea分析称,DeepSeek的突破是通过实施大量细粒度优化,以及在某些功能中使用Nvidia的汇编式PTX(并行线程执行)编程而不是Nvidia的CUDA来实现的。这是否是昨晚英伟达股价再度杀跌的主因,还有待考证。不过,“算力通 ...
这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。 来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高 ...
这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。 来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高 ...
根据Mirae Asset Securities的分析,DeepSeek-V3以惊人的十倍硬件效率超越了许多竞争对手,关键在于其“从零开始重建”的大胆创新。 当DeepSeek在英伟达的H800 GPU上训练V3时,他们将原有132个流式多处理器中的20个重新设定为处理服务器间的通信,而非噪音的计算任务。
这一次是 DeepSeek-V3 论文中的更多细节,被人挖掘出来。 来自 Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3 的硬件效率之所以能比 Meta 等高出 10 倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时,他们针对 ...
这一次是 DeepSeek-V3论文中的更多细节,被人挖掘出来。 来自 Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3 的硬件效率之所以能比 Meta 等高出 10 倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时,他们针对自己 ...
据 @Jukanlosreve 援引韩国未来资产证券(Mirae Asset Securities Korea)的分析,这一突破得益于大量细粒度的优化措施,以及采用了类似汇编语言的英伟达 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果