3月6日凌晨,阿里云发布并开源全新的推理模型通义千问QwQ-32B。官方称,这个新模型仅仅拥有320亿参数,但在性能上比肩6710亿参数的满血版DeepSeek R1。
今天凌晨 3 点,阿里开源发布了新推理模型 QwQ-32B,其参数量为 320 亿,但性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。 千问的推文表示:「这次,我们研究了扩展 RL 的方法,并基于我们的 Qwen2.5-32B ...
最近DeepSeek火爆出圈,引发了国际AI领域的高度重视,纷纷开始研究DeepSeek——正像前几年国内的AI公司研究ChatGPT一样。