Openai O1 Peformance - 搜索 News

OpenAI：强化学习确实可显著提高LLM性能，DeepSeek R1、Kimi k1.5发现o1的秘密

（1 月 20 日，DeepSeek 和 Kimi 在同一天发布推理模型 R1 和 k1.5，两个模型均有超越 OpenAI o1 的表现。）下面，我们先看看这篇论文的核心内容，然后再看看 Matthew Berman 为什么说扩展通用强化学习是「通往 AGI 及更远未来的最清晰路径」。 OpenAI 从自家的三个模型 ...

搜狐5 天

DeepSeek入门宝典-技术解析篇（免费下载）

这篇文档是《DeepSeek入门宝典》的技术解析篇，主要介绍了DeepSeek的基本信息、核心技术、技术贡献、与OpenAI o1的区别、未来进化方向以及产品家族，为读者全面了解DeepSeek提供了丰富的技术资料。 1. DeepSeek概况：幻方量化2023年创立的大模型子公司，2024年1月发布 ...

腾讯网3 天

OpenAI：强化学习确实可显著提高LLM性能，DeepSeek R1、Kimi k1.5发现o1的秘密

（1 月 20 日，DeepSeek 和 Kimi 在同一天发布推理模型 R1 和 k1.5，两个模型均有超越 OpenAI o1 的表现。）下面，我们先看看这篇论文的核心内容，然后再 ...

腾讯网4 天

OpenAI将开源新模型！选择权交给网友，承认闭源策略错误

这个性能不亚于OpenAI o1的模型，仅用了两个月的时间，训练成本仅为550万美元，远低于OpenAI等公司同类AI项目的费用。与此相比，OpenAI的开发和运营 ...

5 天

月之暗面：一年前就验证过长思维链，因成本高先搞了长文本

2 月 18 日上午消息，月之暗面研究员 Flood Sung 近日分享了 k1.5 模型背后的完整思考过程，并透露称， 2024 年 9 月 12 号 OpenAI o1 发布带来的震撼效果，令自己陷入了 Long-CoT 的有效性反思中。因为 ...

搜狐4 天

OpenAI认错！DeepSeek掀起新浪潮：四模型同日开源

但更重要的其实是不同于 o1 模型，DeepSeek 此前用 R1 彻底揭开了 OpenAI 无论如何都想藏起来的——推理类模型「算法的秘密」，给更多人、更多厂商复制和超越 o1 的可能。过去，大模型行业默认接受了封闭模式——从 GPT-3 之后，AI 技术的进步被归结为「资源游戏 ...

站长之家6 天

月之暗面解密o1:Long-CoT是关键，模型思考需要"放长线"

月之暗面研究员Flood Sung近日发表万字长文，首次详细披露了k1.5模型的研发思路，并就OpenAI o1模型带来的技术启示进行深度反思。据Flood Sung介绍，Long-CoT（长链条思维）的重要性其实早在一年多前就已被月之暗面联合创始人Tim周昕宇验证。通过使用小型模型训练 ...

51CTO5 天

OpenAI揭示o3的推理过程，以弥合与DeepSeek-R1的差距

以下是展示思维链非常重要的原因。在本文作者之前的对比实验中，发现OpenAI公司的o1模型在处理来自网络的噪声数据时略优于DeepSeek-R1。然而，由于o1没有揭示其思维链，因此很难对其错误进行故障排除（而且当这两个模型不是解决简单问题时，它们都会出现 ...

新浪网5 天

OpenAI真要开源了？奥特曼发起投票，还预热了一波GPT-4.5

山姆·奥特曼发起的投票此前，在中国AI初创公司深度求索推出性能比肩OpenAI o1模型正式版的开源大模型DeepSeek-R1后，奥特曼评价称，DeepSeek让OpenAI的 ...

太平洋电脑网6 天

月之暗面：一年前验证过长思维链因成本高先搞了长文本

因为 Long-CoT 的有效性，在一年多前就被验证过。使用很小的模型训练模型做几十位的加减乘除运算，并将细粒度的运算合成为非常长的 CoT 数据进行 SFT 处理时可以获得非常好的效果。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果