Arc AGI - 搜索 News

资讯

Hugging Face进军机器人领域收购法国初创公司Pollen Robotics

人工智能开发平台Hugging Face近日宣布收购法国人形机器人初创公司Pollen Robotics，进一步拓展其在机器人领域的布局。此次收购虽未公开交易金额，但据《连线》杂志报道，Hugging Face计划销售Pollen的明星产品——人形机器人Reachy 2，并邀请开发者参与代码改进。

8 天

AGI基准测试大对决：ARC-AGI与GAIA如何重塑AI发展？

总体来看，ARC-AGI与GAIA的结合使得AI的评估和开发更加全面和精细。随着技术的不断发展，未来的AI不仅要在理论知识上具备优势，还需在实际应用中展现出色的操作能力。像这样的双重标准将推动AGI的创新与提升，从而为智能系统的普及和应用开辟更广阔的 ...

8 天

AI“智商”大考变革！全新GAIA基准超越 ARC-AGI

面对传统基准的不足，AI行业正在积极探索新的评估框架。近期发布的ARC-AGI基准旨在推动模型向通用推理和创造性问题解决能力发展，受到了业界的欢迎。另一项引人注目的新基准是“人类最后考试”，它包含了3000道同行评审的多步骤问题，涵盖多个学科，试图在专家级推理上挑战AI系统。早期结果显示，OpenAI的模型在该测试发布一个月内就取得了26.6%的成绩，展现了AI的快速进步。

11 天

Grok-3四档定价揭秘：低至0.3美元/百万token，硬刚谷歌Meta

xAI 正式上线 Grok 3 API，一次性推出4种模型，以适配不同应用场景，定价策略灵活，用户可按需选择。同日，谷歌、Anthropic等也推出新的定价策略。 GenAI竞争，越来越激烈了。据Similar ...

36氪14 天

谷歌发145页论文：预测AGI或2030年出现警告可能“永久毁灭人类”

DeepMind报告：AGI或2030年问世，存人类灭绝风险。近日，谷歌旗下DeepMind实验室最新发布了长达145页的人工智能安全报告，称具备人类智能水平的通用 ...

科技讯16 天

OpenAI o3 模型运行成本暴涨预计从 3000 美元涨至 3 万美元

4月3日，上周，负责维护和管理 ARC-AGI 的 Arc Prize Foundation 对 OpenAI的 o3 “推理”人工智能模型在 ARC-AGI 基准测试中的成本估算进行了重大修订 ...

澎湃新闻17 天

o3狂烧3万美金解一题，反被AGI榜单除名！试错1024次不如10岁小孩哥4分钟

【新智元导读】OpenAI o3推理成本从3000美元飙至3万美元，暴增10倍。o3-high靠暴力试错生成4300万字解题，却被ARC-AGI「除名」。短短几个月，最新评估显示，o3推理成本比预初估计暴涨10倍！在ARC-AGI最新测试上，AI单次任务曾用3000美元，而如今已飙升至30000美元 ...

光明网18 天

测AI智商意义何在？

文丨《瞭望东方周刊》记者陈融雪给AI测智商的尝试，本质上是一场人类认知框架的自我审视。 AI能有多聪明？2024年末，OpenAI宣布ChatGPT-o3在ARC-AGI（通用人工智能抽象和推理语料库）基准测试中取得157分，与爱因斯坦、霍金等人类顶尖智力标杆的推定智商比肩 ...

IT之家18 天

OpenAI o3 模型运行成本估算大幅上调：单次任务从 3000 美元涨至 3 万美元

IT之家4 月 3 日消息，上周，负责维护和管理 ARC-AGI 的 Arc Prize Foundation 对 OpenAI 的 o3 “推理”人工智能模型在 ARC-AGI 基准测试中的成本估算进行了重大修订，现在看起来 o3 的运行成本没有那么低。去年 12 月 OpenAI 推出 o3 模型时，与 ARC-AGI 的开发者合作，展示了 ...

19 天on MSN

AI日报：即梦3.0内测直出2K商业海报；ChatGPT又更新图片生成功能；饿 ...

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。7、Genspark发布自动化AI代理SuperAgent具备自主思考、调用工具的能力Genspark最近推出了其全新的自动化AI代理SuperAgent，凭借其强大的自主思考和任务执行能力，迅速成为行业的焦点。用户只需输入感兴趣的主题，系统便能� ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果