红板报 on MSN10 小时
老显卡福音!美团开源首发INT8无损满血版DeepSeek R1美团搜推团队 投稿量子位 | 公众号 QbitAI 满血版DeepSeek R1部署A100,基于INT8量化,相比BF16实现50%吞吐提升! 美团搜推机器学习团队最新开源,实现对DeepSeek R1模型基本无损的INT8精度量化。 要知道,DeepSeek R1原生版本的模型权重为FP8数据格式,对GPU芯片类型有严格限制,仅能被英伟达新型GPU支持(如Ada、Hopper架构芯片),其他型 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果