DeepSeek公司在近期举行的开源周活动中,持续推动其技术开放步伐,继MLA解码核FlashMLA和DeepEP代码库之后,再度迈出重要一步,正式对外公布了DeepGEMM代码库。
在科技领域的竞争愈演愈烈之际,摩尔线程展现出了令人瞩目的实力。近日,DeepSeek宣布启动“开源周”活动,并发布了三个重要的代码库资源,吸引了广大开发者的关注。作为国产GPU的佼佼者,摩尔线程迅速响应,成功适配了两大开源项目——FlashMLA和DeepGEMM。
快科技2月26日消息, DeepSeek启动“开源周”以来,已经陆续开源了三个代码库,而作为国产GPU的代表,摩尔线程已经快速完成对FlashMLA、DeepGEMM的适配。
作为国内率先原生支持FP8计算精度的国产GPU企业,摩尔线程迅速响应,并快速适配DeepSeek的各个开源仓库,旨在为更多GPU开发者赋能。摩尔线程始终致力于推动开源生态的发展,通过技术开放与生态共建,加速国产全功能GPU在AI计算领域的规模化应用, ...
在去年12月关于V3的技术报告中,DeepSeek表示该模型使用了大约2000块英伟达H800进行训练,成本约为600万美元。这个成本远低于规模更大的竞争对手,后者动辄就是几十亿、上万亿美元的投入,OpenAI甚至在DeepSeek的R1模型走红前, ...
【TechWeb】2月26日消息,在宣布开源MLA解码核FlashMLA以及DeepEP两款代码库后,DeepSeek在开源周的第三天宣布开放DeepGEMM代码库。DeepSeek介绍,DeepGEMM是专为简洁高效的FP8通用矩阵乘法(GEMMs ...
2月24日上午,DeepSeek(深度求索)发布首个开源项目FlashMLA。根据DeepSeek在GitHub社区披露的信息,FlashMLA是适用于Hopper GPU(一种英伟达图形处理器架构)的高效MLA(多头潜注意力)解码内核,针对可变长度序列服务进行了优化。在H800(一款英伟达芯片)上可以实现每秒处理3000GB(千兆字节)数据,每秒执行580万亿次浮点运算。 有业内观点认为,目前限 ...
2025年,中国人工智能产业迎来历史性突破。据中研普华报告,中国AI芯片市场规模预计达到1530亿元,同比增长42%,主要得益于算力需求激增和国产替代加速。中国AI产业链已形成完整生态,尤其在大模型开发领域,中国拥有近80个10亿参数以上的大模型,数 ...
今日,A股主要指数继续上行,沪指收涨逾1%,科创50收涨2.17 %,领衔全市场主流宽基指数。 科创50指数ETF (588870)收涨2.3%,收盘价刷新上市以来新高,尾盘溢价走阔, 收盘溢价率达0.27%!
DeepSeek“开源周”第二日,DeepSeek宣布开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。昨天,DeepSeek则开源了代码库Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化。MoE(混合专家架构)和MLA(多头潜在注意力机制)被认为是DeepSeek以低成本实现杰出表现的核心 ...
2月26日消息,DeepSeek公司在开源周期间继续推进其技术开放计划。在早前宣布开源MLA解码核FlashMLA以及DeepEP两款代码库之后,该公司于第三天正式开放了DeepGEMM代码库。据介绍,DeepGEMM是一款专注于实现高效FP8通用 ...
截至2025年2月26日 14:51,恒生科技指数(HSTECH)强势上涨4.85%,成分股美团-W(03690)上涨9.90%,理想汽车-W(02015)上涨8.95%,京东集团-SW(09618)上涨8.90%,小鹏汽车-W(09868),中芯国 ...