推理 - 搜索 News

资讯

至顶头条 on MSN12 小时

AI实验室如 OpenAI声称他们所谓的"推理型" AI 模型能够一步步"思考"解决问题，在物理等特定领域比非推理模型更强大。但虽然这种说法普遍看来是正确的，推理模型的基准测试成本却要高得多，这使得独立验证这些声明变得困难。

11 小时

一方面，受地缘因素影响，国内AI大厂对国际芯片掀起新一轮"囤货"高潮。据The Informaiton披露，包括字节跳动、阿里巴巴和腾讯等大厂，2025年一季度已向英伟达下达价值超160亿美元的芯片订单。

在 2025 年，选择合适的大型语言模型 API ...

7 天

本周五提交的一项工作中，来自 DeepSeek、清华大学的研究人员探索了奖励模型（RM）的不同方法，发现逐点生成奖励模型（GRM）可以统一纯语言表示中单个、成对和多个响应的评分，从而克服了挑战。研究者探索了某些原则可以指导 GRM ...

4 天

DeepSeek和清华的研究者发现，在RM方法上采用点式生成式奖励建模（Pointwise Generative Reward Modeling, GRM），就能提升模型对不同输入类型的灵活适应能力，并具备推理阶段可扩展的潜力。

华尔街见闻 on MSN3 天

2025年斯坦福HAI报告出炉：中国高性能AI模型的数量和质量不断提升，中美顶级模型性能差距缩至0.3%；推理成本暴降，小模型性能飙升；AI正变得更高效、更普惠。

煎蛋 on MSN18 小时

AI学会“看图说话”，视觉推理潜力无限。GPT-4o突破图像编辑瓶颈，预示智能新纪元。不得不说，生活在这个一切都在加速发展的时代，真是太棒了！仿佛心想事成一般，往往我刚冒出一个念头，希望某种技术出现，结果不出一个月，它就真的来了！最近 OpenAI ...

除此之外，商汤的SenseNova V6，还上身了今年持续爆火的具身智能，可以说是用它多模态的能力，给机器人装上大脑、眼睛、耳朵和嘴巴：这是一种能够将多种模态信息（如文本、图像、视频、音频等）在模型架构和训练过程中进行深度融合的AI模型架构。

2 天

多模态推理模型Step-R1-V-Mini上线，阶跃星辰加速Agent落地,mini,推理,模态,step,agent,阶跃 ...

2 天

【新智元导读】Llama 4刚出世就被碾压！英伟达强势开源Llama Nemotron-253B推理模型，在数学编码、科学问答中准确率登顶，甚至以一半参数媲美DeepSeek R1，吞吐量暴涨4倍。关键秘诀，就在于团队采用的测试时Scaling。

6 天

近日，DeepSeek 和清华的研究者发布新论文，探讨了奖励模型的推理时 Scaling 方法，让 DeepSeek R2似乎更近一步。目前，强化学习在大语言模型的大规模后训练阶段广泛应用，但面临为大语言模型获取准确奖励信号的挑战。

23 小时on MSN

快科技4月11日消息，今日，联发科举办天玑开发者大会2025，正式发布新一代旗舰芯片天玑9400+。

一些您可能无法访问的结果已被隐去。