MLA - 搜索 News

6 小时

作为国内率先原生支持FP8计算精度的国产GPU企业，摩尔线程迅速响应，并快速适配DeepSeek的各个开源仓库，旨在为更多GPU开发者赋能。摩尔线程始终致力于推动开源生态的发展，通过技术开放与生态共建，加速国产全功能GPU在AI计算领域的规模化应用， ...

6 小时

摩尔线程GPU再创新高！FP8计算能力助力DeepSeek开源库

在科技领域的竞争愈演愈烈之际，摩尔线程展现出了令人瞩目的实力。近日，DeepSeek宣布启动“开源周”活动，并发布了三个重要的代码库资源，吸引了广大开发者的关注。作为国产GPU的佼佼者，摩尔线程迅速响应，成功适配了两大开源项目——FlashMLA和DeepGEMM。

7 小时

原生FP8！摩尔线程GPU闪电适配DeepSeek开源库FlashMLA、DeepGEMM

快科技2月26日消息， DeepSeek启动“开源周”以来，已经陆续开源了三个代码库，而作为国产GPU的代表，摩尔线程已经快速完成对FlashMLA、DeepGEMM的适配。

13 小时

DeepSeek“开源周”最新信息，两大核心武器连续掏出

DeepSeek“开源周”第二日，DeepSeek宣布开源DeepEP，第一个用于MoE模型训练和推理的开源EP通信库。昨天，DeepSeek则开源了代码库Flash MLA，这是针对Hopper GPU优化的高效MLA解码内核，针对可变长度序列作了优化。MoE（混合专家架构）和MLA（多头潜在注意力机制）被认为是DeepSeek以低成本实现杰出表现的核心 ...

凤凰网14 小时

DeepSeek放大招！开源“新星”FlashMLA登场：大模型效率革命能否破解 ...

2月24日上午，DeepSeek（深度求索）发布首个开源项目FlashMLA。根据DeepSeek在GitHub社区披露的信息，FlashMLA是适用于Hopper GPU（一种英伟达图形处理器架构）的高效MLA（多头潜注意力）解码内核，针对可变长度序列服务进行了优化。在H800（一款英伟达芯片）上可以实现每秒处理3000GB（千兆字节）数据，每秒执行580万亿次浮点运算。有业内观点认为，目前限 ...

来自MSN2 天

DeepSeek启动开源周，已开源Flash MLA代码库

继此前在2月21日DeepSeek方面预告“开源周”计划，宣布将从2月24日起陆续开源5个代码库，以完全透明的方式与全球开发者社区分享“微小但真诚”的研究进展后。

2 天on MSN

DeepSeek今日启动开源周：公布首个开源代码库Flash MLA

快科技2月24日消息，据报道，DeepSeek宣布启动“开源周”，首个开源的代码库为Flash MLA。这是一个针对Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列而设计，目前已投入实际生产应用。与传统解码器相比，Flash ...

搜狐14 天

飞利信回应MLA技术疑云：知识产权问题需深入解读

在最新的投资者关系平台上，飞利信（300287）回应了关于其MLA技术的重大关注。在投资者询问deepseek开源大模型中MLA是否获得公司授权，并涉及其知识产权和相关赔偿问题时，飞利信表示尚不清楚该技术的专利拥有者。这一信息引发了市场的广泛讨论，尤其是在AI ...

IT之家22 天

DeepSeek V3 和 R1 模型完成海光 DCU 国产化适配并正式上线

据介绍，DeepSeek V3 和 R1 模型基于 Transformer 架构，采用了 Multi-Head Latent Attention（MLA）和 DeepSeek MoE 两大核心技术。MLA 通过减少 KV 缓存显著降低了内存占用，提升了推理效率；DeepSeek MoE 则通过辅助损失（auxiliary loss）实现了专家负载的智能平衡，进一步优化了模型 ...

搜狐25 天

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出 ...

【新智元报道】近来，中国AI领域的DeepSeek如同一个闪电般在全球范围内引发热议。这家初创公司以其突破性的技术——多头潜注意力机制（MLA ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果