梦晨 发自 凹非寺量子位 | 公众号 QbitAI 见识过32B的QwQ追平671的DeepSeek R1后—— 刚刚,7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事? 新方法LADDER,通过递归问题分解实现AI模型的自我改进,同时不需要人工标注数据。 使Deepseek-R1蒸馏的Qwen2.5 7B模型在麻省理工学院积分大赛(MIT Integration Bee)上达到90分 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果一些您可能无法访问的结果已被隐去。
显示无法访问的结果