2月17日上午,月之暗面研究员Flood Sung分享了k1.5模型背后的思考过程,并表示2024年OpenAI o1发布的效果让他思考了Long-CoT的有效性。月之暗面Kimi联合创始人Tim周昕宇在一年多前验证过,通过训练小模型做运算并合成长的CoT数据,可以获得良好效果。公司意识到Long Context的重要性,开始考虑将Context搞长。尽管Long-CoT成本较高且速度慢,但Flo ...
因为 Long-CoT 的有效性,在一年多前就被验证过。使用很小的模型训练模型做几十位的加减乘除运算,并将细粒度的运算合成为非常长的 CoT 数据进行 SFT 处理时可以获得非常好的效果。
DeepSeek R1 和 OpenAI o1 是推理类 LLM 发展的重要里程碑。DeepSeek R1 有效地展示了强化学习和提炼技术在增强推理能力方面的潜力。 过去12个月,大型语言模型 (LLM) 的重头戏是增强其推理能力,以弥补与通用人工智能 (AGI) 的差距。DeepSeek R1 和OpenAI o1是引领这一发展的 ...
1月20日,中国AI初创公司深度求索推出开源大模型DeepSeek-R1,性能比肩OpenAI o1模型正式版,而训练成本或仅需约600万美元。 如此“物美价廉”,Meta、微软、OpenAI、Anthropic等公司纷纷关注跟进。投资界大佬们也都现身表态,方舟投资(ARK)CEO“木头姐”凯西·伍德 ...
深度学习的迅猛发展使得增强推理能力的需求愈加迫切。本篇文章将深入对比DeepSeek R1和OpenAI o1这两款当下领先的推理模型,解析它们在架构设计、训练方法、性能表现、优势与不足等方面的异同,以及在全球AI生态系统中的意义。 模型概述 DeepSeek R1 DeepSeek R1是 ...
让我们再次感谢 DeepSeek。 今天凌晨,OpenAI 宣布公开最新模型 o3-mini 系列模型的思维链。 简单来说,用户现在可以看到 o3-mini 以及 o3-mini(high) 的「思考」过程,更清晰地了解模型是如何推理并得出结论的。 OpenAI 研究科学家 Noam Brown 在 X 平台发文称: 「在 o1-Preview 发布前,我们向大家介绍 🍓 时,看到思维链(CoT ...
16 天
来自MSN当DeepSeek改写AI叙事,突破“内存墙”的MRDIMM将是下一个爆点?2025年的春节,可能是中国有史以来科技味最浓的。一切,都只因为DeepSeek的横空出世。 作为全球增速最快的AI应用,DeepSeek上线20天来,日活用户数突破2000万,目前达到了ChatGPT的23%,并且应用每日下载量接近500万。饶毅教授甚至在其个人公众号上评价道,“DeepSeek是鸦片战争以来,中国对人类最大的科技震撼。” ...
如果进军人形机器人本体研发,那么OpenAI与合作伙伴之间将处于既竞争又合作的矛盾关系。 从上个月开始,中国 AI 创业公司 DeepSeek 推出的 R1 模型抢走了 o1 的风头。R1 是一个高效的开源推理模型,全球任何人都可以免费获取、重新训练和定制,还可以在 DeepSeek ...
2 月 5 日下午消息,近日,面壁智能联合创始人兼首席科学家刘知远在谈及 DeepSeek 近期引发的热潮时指出,“DeepSeek 最近发布 R1 模型的重要价值在于它能够完美复现 OpenAI o1 的深度推理能力,并且他通过开源的方式发布了相对详细的介绍,为行业作出了重要贡献 ...
Hugging Face 的团队,包括公司联合创始人兼首席科学家 Thomas Wolf,表示他们的开放深度研究项目结合了 OpenAI 的 o1模型和一个开源的 “代理框架”。这个框架旨在帮助模型更好地进行信息分析,并指导其使用搜索引擎等工具。尽管 o1是一个付费的专有模型 ...
这也不是OpenAI的推理模型第一次玩语言游戏。根据TechCrunch报道,在 OpenAI 发布其首个推理模型 o1 后不久,人们注意到一种奇怪的现象。该模型有时会在回答问题时“用中文、波斯语或其他语言思考”——即便问题是用英文提出的。 当被要求解决某个问题时 ...
该测试涵盖100多个学科,包含3000多道涵盖多个学术领域的专家级问题,包括语言学、航天工程、古典学和生态学。 与OpenAI o1相比,Deep Research在化学、人文社会科学和数学领域的表现提升最为显著。 Deep Research所使用的模型在专家级问题上的准确率达到了26.6% ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果