! WAIT - 搜索 News

8 天

成本不足50美元！华裔团队推出S1模型性能媲美DeepSeek

与此形成鲜明对比的是S1模型，它的研发由李飞飞教授的团队主导。与DeepSeek亿万级成本的训练相比，S1的训练费用仅为50美元。从根本上挑战传统AI训练模型的高成本，S1通过独特的创新策略，确保了模型的高效推理能力与精确性。

5 天

福州岁末金色狂欢：石厝教堂百年银杏美翻全城

福州，这座历史与现代交织的城市，在岁末之际迎来了一场金色的狂欢。石厝教堂门前的百年银杏树，以其独特的魅力，成为了这个季节最美的风景。作为一名热爱旅游的我，自然不能错过这一场视觉盛宴，于是，我踏上了探寻银杏之美的旅程。

腾讯网10 天

16张H100训26分钟，超越o1-preview！李飞飞等用1K样本，揭秘测试时Scaling

新智元报道编辑：犀牛【新智元导读】大模型推理性能的提升，真的只能靠堆数据、加算力吗？李飞飞等用仅1000个样本微调模型，并提出预算强制（budget ...

9 天

李飞飞团队低成本复刻DeepSeek-R1模型？算力成本桎梏正在被打破

2024年，李飞飞曾在接受媒体采访时反驳“人工智能模型正在耗尽用于训练的数据”这一观点，她认为当前AI训练数据并不存在短缺的问题，仍有大量的差异化的数据等待挖掘。她强调的是，高质量数据正变得前所未有的重要，创建高质量的数据集是人工智能研究的核心。

EDN电子技术设计9 天

用50美元就可以复现DeepSeek R1？怎么做到的？

据报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

腾讯网16 天

不再更高，但会更久—1月美联储议息会议点评 2025年第1期

本文转载自微信公众号：华创宏观根据《证券期货投资者适当性管理办法》及配套指引，本资料仅面向华创证券客户中的金融机构专业投资者，请勿对本资料进行任何形式的转发。若您不是华创证券客户中的金融机构专业投资者，请勿订阅、接收或使用本资料中的信息。本资料难以设置访问权限，若给您造成不便，敬请谅解。感谢您的理解 ...

11 天

中信证券：维持美联储今年降息2次、每次25bps的判断

中信证券指出，2025年1月美联储议息会议维持政策利率不变，会议声明相对前次会议变化较大，表述在双重风险中更加偏向通胀风险，相较市场预期略偏鹰派。鲍威尔发言内容增量信息不多，美联储如期进入“边走边看（Wait-and-See）”阶段。尽管本次会议总体平淡，但会议声明的较大变化和鲍威尔所讲的“语言清理”却是值得关注的亮点。当前我们维持美联储今年降息2次，每次25bps的判断，联储3月议息会议或将给出 ...

9 天

成本不到150元！26分钟训出个推理模型媲美o1和R1

据TechCrunch，这个训练过程消耗了不到50美元的云计算成本，约合人民币364.61元；而s1模型作者之一表示，训练s1所需的计算资源，在当下约花20美元（约145.844元）就能租到。

7 天

“李飞飞团队50美元炼出DeepSeek R1”，如何被曲解了？

近日，“李飞飞等斯坦福大学和华盛顿大学的研究人员以不到 50 美元的云计算费用，成功训练出了一个名为 s1 的人工智能推理模型”的消息引起了很多人关注。该模型名为 s1，该模型在数学和编码能力测试中的表现，据传与 OpenAI O1 和 ...

2 天

一文读懂：DeepSeek新模型大揭秘，为何它能震动全球AI圈

因为根据DeepSeek的研究，模型的进步并非均匀渐进的。在强化学习过程中，响应长度会出现突然的显著增长，这些"跳跃点"往往伴随着解题策略的质变。这种模式酷似人类在长期思考后的突然顿悟，暗示着某种深层的认知突破。

5 天

带你一文读懂爆火的 DeepSeek-R1 新模型技术，为何震动了全球 AI 圈

举例来说，前 Meta AI 员工、著名 AI 论文推特博主 Elvis 指出， DeepSeek-R1 的论文堪称珍宝，因为它深入探讨了提升大语言模型推理能力的多种途径，并揭示了其中的显著涌现特性。

SHINE3 天

China claims two cross-country relay golds at Winter Asiad

All cross-country skiing events at the Asian Winter Games have concluded, with China winning five of the six gold medals on ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果