快科技2月26日消息, DeepSeek启动“开源周”以来,已经陆续开源了三个代码库,而作为国产GPU的代表,摩尔线程已经快速完成对FlashMLA、DeepGEMM的适配。
作为国内率先原生支持FP8计算精度的国产GPU企业,摩尔线程迅速响应,并快速适配DeepSeek的各个开源仓库,旨在为更多GPU开发者赋能。摩尔线程始终致力于推动开源生态的发展,通过技术开放与生态共建,加速国产全功能GPU在AI计算领域的规模化应用, ...
DeepSeek 开源项目第一弹 FlashMLA,已经在极短的时间内发酵到全网了,短短几个小时,该项目就已经收获了超过 3.5K Star,且还在不断飙升。 虽然 FlashMLA 里的每个字母都认识,连在一起就看不懂了。别急,我们整理了一份 ...
17 小时
知乎 on MSNDeepSeek 开源周第一天开源的项目 FlashMLA,有哪些亮点值得关注?跟大家预想的差不多,最先开源的果然是推理效率方面的,可以说是官方教大家怎么跑模型了。 其实早在 DeepSeek 开源之初,就有很多人认为 DeepSeek 手里还有一些推理的技巧没放出来。 最直观的一个原因就是 DeepSeek 官方提供的 API ...
7 小时on MSN
DeepSeek公司在近期举行的开源周活动中,持续推动其技术开放步伐,继MLA解码核FlashMLA和DeepEP代码库之后,再度迈出重要一步,正式对外公布了DeepGEMM代码库。
2月24日上午,DeepSeek(深度求索)发布首个开源项目FlashMLA。根据DeepSeek在GitHub社区披露的信息,FlashMLA是适用于Hopper GPU(一种英伟达图形处理器架构)的高效MLA(多头潜注意力)解码内核,针对可变长度序列服务进行了优化。在H800(一款英伟达芯片)上可以实现每秒处理3000GB(千兆字节)数据,每秒执行580万亿次浮点运算。 有业内观点认为,目前限 ...
【TechWeb】2月26日消息,在宣布开源MLA解码核FlashMLA以及DeepEP两款代码库后,DeepSeek在开源周的第三天宣布开放DeepGEMM代码库。DeepSeek介绍,DeepGEMM是专为简洁高效的FP8通用矩阵乘法(GEMMs ...
今日,A股主要指数继续上行,沪指收涨逾1%,科创50收涨2.17 %,领衔全市场主流宽基指数。 科创50指数ETF (588870)收涨2.3%,收盘价刷新上市以来新高,尾盘溢价走阔, 收盘溢价率达0.27%!
DeepSeek“开源周”第二日,DeepSeek宣布开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。昨天,DeepSeek则开源了代码库Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化。MoE(混合专家架构)和MLA(多头潜在注意力机制)被认为是DeepSeek以低成本实现杰出表现的核心 ...
在去年12月关于V3的技术报告中,DeepSeek表示该模型使用了大约2000块英伟达H800进行训练,成本约为600万美元。这个成本远低于规模更大的竞争对手,后者动辄就是几十亿、上万亿美元的投入,OpenAI甚至在DeepSeek的R1模型走红前, ...
近日,DeepSeek的横空出世在科技界引发巨大震动。中国工程院院士李国杰在《科技导报》发表文章,深入剖析了这一AI里程碑事件背后的七大核心问题,引发了学界与业界的广泛讨论。
截至2025年2月26日 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果