Matth - 搜索 News

报告主题：MATH-Perturb：评估大语言模型在面对复杂改动时的数学推理能力报告日期：02月27日（本周四）10:30-11:30报告要点:大型语言模型在高难度数学推理任务上展现出了令人惊叹的能力，这引发了其是由真正的推理能力还是记忆能力（背题） ...

19 小时

在两月的最后一个周末，湖人队在主场以107-99击败独行侠，这场比赛不仅是一场普通的常规赛，更是一个特殊的历史时刻，卢卡·东契奇迎来了他的湖人生涯首次三双，19分、15篮板和12助攻的华丽数据背后，是无Math能量与情感的交织，以及对前东家的深切回应。

14 小时

Kimi未来还能够翻盘吗？从公司发展路径上来看，并非没有可能。作为曾经对OpenAI技术跟随最快的公司，Kimi在去年做出了Kimi探索版、k0-math等多个跟随OpenAI技术的模型，而杨植麟本人也在采访中，表示大模型的未来不仅在于强化学习，还在 ...

11 小时

DeepSeek发布使得科技公司对英伟达高端芯片需求会减少，但是市场对于AI芯片的总需求却不一定会减少。正如经济学家杰文斯所言：技术进步虽然提高了资源的使用效率，但需求的增加常常会导致总消耗量反而增加。

2 天

DeepSeek R1 的技术报告验证了知识蒸馏+SFT的方法能够让小模型获得优越的推理能力。这种看似极具性价比的方案引发了大量关注和剖析。由于业界对蒸馏的工艺和上限尚未形成共识，因此也带来了对该技术更为系统的探索工作。

研究团队还分析了模型规模与训练效率之间的关系。结果表明，较大模型通常需要更少的训练步骤即可达到相同的性能水平，但较小模型通过更长时间的训练也能达到相近的性能上限。这种"规模-训练时间"权衡为资源受限环境下的模型选择提供了有价值的指导。

来自MSN17 小时

01摘要当全球科技巨头还在为AI模型的高昂成本发愁时，一家成立仅两年的中国初创企业DeepSeek，以"性能比肩OpenAI、价格仅为二十七分之一、全栈开源"的颠覆性突破，正在掀起人工智能领域的"中国风暴"。最新数据显示，其旗舰产品DeepSeek- ...

22 小时

Claude 3.7 Sonnet 既能提供近乎即时的响应（标准模式，standard），也可以向用户直观展示其长时间的逐步思考过程（扩展思考模式，extended thinking）。API 用户还可以对模型的思考时长进行细粒度控制。当地时间 2 ...

20 天

VanEck数字资产研究总监 Matthew Sigel 表示，市值1000 亿美元的在线经纪公司盈透证券 Interactive Brokers (IBKR）计划提供更多的加密货币代币，待监管明确后，首个将提供的代币是SOL。目前将客户的加密资产配置上限设为1%，未来将提高这一比例。

1 天

研究团队开发出名为 Huginn 的新型语言模型，该模型采用递归架构，显著提升了推理能力。与传统模型不同，Huginn 无需专门的“推理链”训练，便可在神经网络的“潜在空间”内自主推理，再输出结果。

1 天

该系统名为“AlphaGeometry2”（AG2），是一个先进的人工智能框架，能够解决国际数学奥林匹克竞赛（IMO）中84%的几何问题。而国际数学奥林匹克人类金牌得主平均只解决了81.8%的奥林匹克问题。

12 小时on MSN

在AI领域，一场前所未有的变革正悄然兴起，而这一切的导火索，便是DeepSeek的惊艳亮相。DeepSeek以其独特的技术路径，挑战了传统AI训练对于硬件资源的极致依赖。

一些您可能无法访问的结果已被隐去。