作为国内率先原生支持FP8计算精度的国产GPU企业,摩尔线程迅速响应,并快速适配DeepSeek的各个开源仓库,旨在为更多GPU开发者赋能。摩尔线程始终致力于推动开源生态的发展,通过技术开放与生态共建,加速国产全功能GPU在AI计算领域的规模化应用, ...
在科技领域的竞争愈演愈烈之际,摩尔线程展现出了令人瞩目的实力。近日,DeepSeek宣布启动“开源周”活动,并发布了三个重要的代码库资源,吸引了广大开发者的关注。作为国产GPU的佼佼者,摩尔线程迅速响应,成功适配了两大开源项目——FlashMLA和DeepGEMM。
快科技2月26日消息, DeepSeek启动“开源周”以来,已经陆续开源了三个代码库,而作为国产GPU的代表,摩尔线程已经快速完成对FlashMLA、DeepGEMM的适配。
DeepSeek“开源周”第二日,DeepSeek宣布开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。昨天,DeepSeek则开源了代码库Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化。MoE(混合专家架构)和MLA(多头潜在注意力机制)被认为是DeepSeek以低成本实现杰出表现的核心 ...
2月24日上午,DeepSeek(深度求索)发布首个开源项目FlashMLA。根据DeepSeek在GitHub社区披露的信息,FlashMLA是适用于Hopper GPU(一种英伟达图形处理器架构)的高效MLA(多头潜注意力)解码内核,针对可变长度序列服务进行了优化。在H800(一款英伟达芯片)上可以实现每秒处理3000GB(千兆字节)数据,每秒执行580万亿次浮点运算。 有业内观点认为,目前限 ...
继此前在2月21日DeepSeek方面预告“开源周”计划,宣布将从2月24日起陆续开源5个代码库,以完全透明的方式与全球开发者社区分享“微小但真诚”的研究进展后。
快科技2月24日消息,据报道,DeepSeek宣布启动“开源周”,首个开源的代码库为Flash MLA。 这是一个针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,目前已投入实际生产应用。 与传统解码器相比,Flash ...