资讯
12 小时
至顶头条 on MSNAI 推理模型的兴起使基准测试成本大幅提升AI实验室如 OpenAI声称他们所谓的"推理型" AI 模型能够一步步"思考"解决问题,在物理等特定领域比非推理模型更强大。但虽然这种说法普遍看来是正确的,推理模型的基准测试成本却要高得多,这使得独立验证这些声明变得困难。
一方面,受地缘因素影响,国内AI大厂对国际芯片掀起新一轮"囤货"高潮。据The Informaiton披露,包括字节跳动、阿里巴巴和腾讯等大厂,2025年一季度已向英伟达下达价值超160亿美元的芯片订单。
在 2025 年,选择合适的大型语言模型 API ...
本周五提交的一项工作中,来自 DeepSeek、清华大学的研究人员探索了奖励模型(RM)的不同方法,发现逐点生成奖励模型(GRM)可以统一纯语言表示中单个、成对和多个响应的评分,从而克服了挑战。 研究者探索了某些原则可以指导 GRM ...
DeepSeek和清华的研究者发现,在RM方法上采用点式生成式奖励建模(Pointwise Generative Reward Modeling, GRM),就能提升模型对不同输入类型的灵活适应能力,并具备推理阶段可扩展的潜力。
3 天
华尔街见闻 on MSN2025年斯坦福HAI报告:中美AI模型差距骤缩至0.3%,推理成本暴降280倍2025年斯坦福HAI报告出炉:中国高性能AI模型的数量和质量不断提升,中美顶级模型性能差距缩至0.3%;推理成本暴降,小模型性能飙升;AI正变得更高效、更普惠。
18 小时
煎蛋 on MSN大模型即将开启视觉推理时代AI学会“看图说话”,视觉推理潜力无限。GPT-4o突破图像编辑瓶颈,预示智能新纪元。 不得不说,生活在这个一切都在加速发展的时代,真是太棒了!仿佛心想事成一般,往往我刚冒出一个念头,希望某种技术出现,结果不出一个月,它就真的来了!最近 OpenAI ...
除此之外,商汤的SenseNova V6,还上身了今年持续爆火的具身智能,可以说是用它多模态的能力,给机器人装上大脑、眼睛、耳朵和嘴巴: 这是一种能够将多种模态信息(如文本、图像、视频、音频等)在模型架构和训练过程中进行深度融合的AI模型架构。
多模态推理模型Step-R1-V-Mini上线,阶跃星辰加速Agent落地,mini,推理,模态,step,agent,阶跃 ...
【新智元导读】Llama 4刚出世就被碾压!英伟达强势开源Llama Nemotron-253B推理模型,在数学编码、科学问答中准确率登顶,甚至以一半参数媲美DeepSeek R1,吞吐量暴涨4倍。关键秘诀,就在于团队采用的测试时Scaling。
近日,DeepSeek 和清华的研究者发布新论文,探讨了奖励模型的推理时 Scaling 方法,让 DeepSeek R2似乎更近一步。目前,强化学习在大语言模型的大规模后训练阶段广泛应用,但面临为大语言模型获取准确奖励信号的挑战。
23 小时on MSN
快科技4月11日消息,今日,联发科举办天玑开发者大会2025,正式发布新一代旗舰芯片天玑9400+。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果