O1 - 搜索 News

1 天

总结而言，类O1大模型的技术路线正在逐步完善，推动着AI领域不断向前迈进。这一系列的创新实践，展示了如何有效突破传统强化学习的限制，探索出更高效的推理能力提升方法。在未来的研究中，期待更多的学者和研究团队参与到这一激动人心的探索中，共同推动AI技术的 ...

腾讯网6 小时

DeepSeek-R1、o1都在及格线挣扎！字节开源全新知识推理测评集，覆盖285 ...

允中发自凹非寺量子位 | 公众号 QbitAI大模型刷榜 MMLU、屠榜 GPQA ...

1 天

科大讯飞星火 X1 模型升级，数学能力全面对标 DeepSeek R1 和 OpenAI o1

科大讯飞表示，此次升级在数学答题效果上全面提升，尤其是应对竞赛级难题表现显著。同时，星火 X1 在中小学数学作业的批改、辅导以及题目推荐等任务上也展现出了明显的优势。测试集合来源：中文测试集来自 2023/2024 年各学段考试真题 / 模拟题 / ...

腾讯网4 小时

科大讯飞全国产深度推理模型星火X1升级，联合华为推出星火一体机

据科大讯飞微信公众号3月3日消息，该公司于近日完成了星火深度推理模型X1的全面升级，并基于星火X1首发星火医疗大模型X1。作为当前唯一采用全国产算力训练的深度推理大模型，星火X1数学能力与DeepSeek R1和OpenAI ...

5 天on MSN

Kimi 最新模型 k1.6 曝光，编程能力超越 GPT o3mini、o1

IT之家 2 月 27 日消息，Kimi 最新模型 k1.6 今日曝光。据全球动态基准测试平台 LiveCodeBench， Kimi k1.6 超过 GPT o3mini、o1 等模型，在代码生成测试中实现登顶。

3 小时

消息称亚马逊正开发推理模型 Nova：又要快又要能深度思考

推理模型近年来已成为人工智能领域的下一个突破。这类模型虽然运算较慢，但能通过多次尝试和链式思维回溯解决更为复杂的问题。谷歌、OpenAI 和 Anthropic 等公司近期纷纷推出了自己的推理模型，而 DeepSeek ...

GitHub13 小时

Cailailai/chatgpt-chinese-zh

本指南提供 ChatGPT 中文版使用指南，汇总国内可用的 ChatGPT镜像网站和官网使用教程帮助您快速上手 ChatGPT，无论是个人使用还是专业需求，均可无限使用 ChatGPT-4、4o 和 o1！为什么选择 ChatGPT 中文版？ ChatGPT 中文版是 OpenAI开发的 ChatGPT模型的中文优化版本 ...

GitHub2 天

ChatGPT 中文版：国内免费使用指南及镜像网站推荐（支持 GPT-4o 和 o1 ...

免费试用：提供初始免费额度，方便用户体验各项功能。推荐的 ChatGPT 中文版镜像网站 chat.yixiaai.com：这是一个稳定运营近两年的ChatGPT中文版平台，支持 GPT-4、4o 和 o1 模型，有 AI绘画功能。chat.lify.vip：该ChatGPT镜像网站集成了最新的 ChatGPT模型，包括 GPT-4o、4o ...

来自MSN13 小时

如何看待 Anthropic 发布的混合推理模型 Claude 3.7 Sonnet？

实测了下，这里分享下结果。虽然我不喜欢Dario Amodei这个人，讨厌他的傲慢和偏见，但不得不承认，日常工作还是离不开claude的，claude最强的地方在于它的代码能力。说句实话，你看chatbot arena上，claude 3.5 ...

11 小时

DeepSeek利润神话背后：大厂AI的焦虑和自救

在过去几年的“百模大战”中，国内外AI大模型公司砸出了几十亿甚至上百亿美元，而DeepSeek仅以557.6万美元的GPU成本，就训练出了与OpenAI o1能力不相上下的DeepSeekR1模型，这让大厂开始反思。

4 天

DeepSeek-R1自写CUDA内核跑分屠榜！斯坦福学霸狂飙GPU编程自动化挑战人类

Level 1包含100个单个基本操作，如卷积、矩阵乘法等AI基础构建块。虽然PyTorch调用了经过优化的闭源内核，让LLM超越基线具有挑战性，但如果能生成开源内核，将有重要价值。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果