MLA - 搜索 News

6 小时

作为国内率先原生支持FP8计算精度的国产GPU企业，摩尔线程迅速响应，并快速适配DeepSeek的各个开源仓库，旨在为更多GPU开发者赋能。摩尔线程始终致力于推动开源生态的发展，通过技术开放与生态共建，加速国产全功能GPU在AI计算领域的规模化应用， ...

7 小时

摩尔线程GPU再创新高！FP8计算能力助力DeepSeek开源库

在科技领域的竞争愈演愈烈之际，摩尔线程展现出了令人瞩目的实力。近日，DeepSeek宣布启动“开源周”活动，并发布了三个重要的代码库资源，吸引了广大开发者的关注。作为国产GPU的佼佼者，摩尔线程迅速响应，成功适配了两大开源项目——FlashMLA和DeepGEMM。

7 小时

原生FP8！摩尔线程GPU闪电适配DeepSeek开源库FlashMLA、DeepGEMM

快科技2月26日消息， DeepSeek启动“开源周”以来，已经陆续开源了三个代码库，而作为国产GPU的代表，摩尔线程已经快速完成对FlashMLA、DeepGEMM的适配。

13 小时

DeepSeek“开源周”最新信息，两大核心武器连续掏出

DeepSeek“开源周”第二日，DeepSeek宣布开源DeepEP，第一个用于MoE模型训练和推理的开源EP通信库。昨天，DeepSeek则开源了代码库Flash MLA，这是针对Hopper GPU优化的高效MLA解码内核，针对可变长度序列作了优化。MoE（混合专家架构）和MLA（多头潜在注意力机制）被认为是DeepSeek以低成本实现杰出表现的核心 ...

凤凰网14 小时

DeepSeek放大招！开源“新星”FlashMLA登场：大模型效率革命能否破解 ...

2月24日上午，DeepSeek（深度求索）发布首个开源项目FlashMLA。根据DeepSeek在GitHub社区披露的信息，FlashMLA是适用于Hopper GPU（一种英伟达图形处理器架构）的高效MLA（多头潜注意力）解码内核，针对可变长度序列服务进行了优化。在H800（一款英伟达芯片）上可以实现每秒处理3000GB（千兆字节）数据，每秒执行580万亿次浮点运算。有业内观点认为，目前限 ...

来自MSN2 天

DeepSeek启动开源周，已开源Flash MLA代码库

继此前在2月21日DeepSeek方面预告“开源周”计划，宣布将从2月24日起陆续开源5个代码库，以完全透明的方式与全球开发者社区分享“微小但真诚”的研究进展后。

2 天on MSN

DeepSeek今日启动开源周：公布首个开源代码库Flash MLA

快科技2月24日消息，据报道，DeepSeek宣布启动“开源周”，首个开源的代码库为Flash MLA。这是一个针对Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列而设计，目前已投入实际生产应用。与传统解码器相比，Flash ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果