可比 comparability - 搜索 News

36氪18 天

DeepSeek是新源神，推理模型o1性能1/50价格，微调/数据/商用全免费 ...

开源DeepSeek-R1推理大模型，与o1性能相近。‍‍ 开源DeepSeek-R1-Zero，预训练模型直接RL，不走SFT，堪称语言模型的AlphaZero。开源用R1数据蒸馏的Qwen ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果