MLA - 搜索 News

3 小时

原生FP8！摩尔线程GPU闪电适配DeepSeek开源库FlashMLA、DeepGEMM

快科技2月26日消息， DeepSeek启动“开源周”以来，已经陆续开源了三个代码库，而作为国产GPU的代表，摩尔线程已经快速完成对FlashMLA、DeepGEMM的适配。

2 小时

作为国内率先原生支持FP8计算精度的国产GPU企业，摩尔线程迅速响应，并快速适配DeepSeek的各个开源仓库，旨在为更多GPU开发者赋能。摩尔线程始终致力于推动开源生态的发展，通过技术开放与生态共建，加速国产全功能GPU在AI计算领域的规模化应用， ...

22 小时

一文看懂 DeepSeek 刚刚开源的 FlashMLA，这些细节值得注意

DeepSeek 开源项目第一弹 FlashMLA，已经在极短的时间内发酵到全网了，短短几个小时，该项目就已经收获了超过 3.5K Star，且还在不断飙升。虽然 FlashMLA 里的每个字母都认识，连在一起就看不懂了。别急，我们整理了一份 ...

知乎 on MSN17 小时

DeepSeek 开源周第一天开源的项目 FlashMLA，有哪些亮点值得关注？

跟大家预想的差不多，最先开源的果然是推理效率方面的，可以说是官方教大家怎么跑模型了。其实早在 DeepSeek 开源之初，就有很多人认为 DeepSeek 手里还有一些推理的技巧没放出来。最直观的一个原因就是 DeepSeek 官方提供的 API ...

7 小时on MSN

DeepSeek再放大招！高效FP8矩阵乘法库DeepGEMM正式开源

DeepSeek公司在近期举行的开源周活动中，持续推动其技术开放步伐，继MLA解码核FlashMLA和DeepEP代码库之后，再度迈出重要一步，正式对外公布了DeepGEMM代码库。

凤凰网11 小时

DeepSeek放大招！开源“新星”FlashMLA登场：大模型效率革命能否破解 ...

2月24日上午，DeepSeek（深度求索）发布首个开源项目FlashMLA。根据DeepSeek在GitHub社区披露的信息，FlashMLA是适用于Hopper GPU（一种英伟达图形处理器架构）的高效MLA（多头潜注意力）解码内核，针对可变长度序列服务进行了优化。在H800（一款英伟达芯片）上可以实现每秒处理3000GB（千兆字节）数据，每秒执行580万亿次浮点运算。有业内观点认为，目前限 ...

腾讯网9 小时

DeepSeek代码开源第三弹：DeepGEMM代码库，V3/R1的训练推理动力

【TechWeb】2月26日消息，在宣布开源MLA解码核FlashMLA以及DeepEP两款代码库后，DeepSeek在开源周的第三天宣布开放DeepGEMM代码库。DeepSeek介绍，DeepGEMM是专为简洁高效的FP8通用矩阵乘法（GEMMs ...

东方财富网9 小时

A股三大股指单边上行，科创板一马当先！科技主线大放异彩，科创50 ...

今日，A股主要指数继续上行，沪指收涨逾1%，科创50收涨2.17 %，领衔全市场主流宽基指数。科创50指数ETF (588870)收涨2.3%，收盘价刷新上市以来新高，尾盘溢价走阔，收盘溢价率达0.27%！

9 小时

DeepSeek“开源周”最新信息，两大核心武器连续掏出

DeepSeek“开源周”第二日，DeepSeek宣布开源DeepEP，第一个用于MoE模型训练和推理的开源EP通信库。昨天，DeepSeek则开源了代码库Flash MLA，这是针对Hopper GPU优化的高效MLA解码内核，针对可变长度序列作了优化。MoE（混合专家架构）和MLA（多头潜在注意力机制）被认为是DeepSeek以低成本实现杰出表现的核心 ...

5 小时

DeepSeek连开三源，解开训练省钱之谜

在去年12月关于V3的技术报告中，DeepSeek表示该模型使用了大约2000块英伟达H800进行训练，成本约为600万美元。这个成本远低于规模更大的竞争对手，后者动辄就是几十亿、上万亿美元的投入，OpenAI甚至在DeepSeek的R1模型走红前， ...

10 小时

李国杰院士七问DeepSeek，解析AI发展新趋势

近日，DeepSeek的横空出世在科技界引发巨大震动。中国工程院院士李国杰在《科技导报》发表文章，深入剖析了这一AI里程碑事件背后的七大核心问题，引发了学界与业界的广泛讨论。

腾讯网12 小时

DeepSeek持续开源，科创AIETF盘中涨超2%，芯原股份涨超12%

截至2025年2月26日 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果