资讯

人工智能开发平台Hugging Face近日宣布收购法国人形机器人初创公司Pollen Robotics,进一步拓展其在机器人领域的布局。此次收购虽未公开交易金额,但据《连线》杂志报道,Hugging Face计划销售Pollen的明星产品——人形机器人Reachy 2,并邀请开发者参与代码改进。
总体来看,ARC-AGI与GAIA的结合使得AI的评估和开发更加全面和精细。随着技术的不断发展,未来的AI不仅要在理论知识上具备优势,还需在实际应用中展现出色的操作能力。像这样的双重标准将推动AGI的创新与提升,从而为智能系统的普及和应用开辟更广阔的 ...
面对传统基准的不足,AI行业正在积极探索新的评估框架。近期发布的ARC-AGI基准旨在推动模型向通用推理和创造性问题解决能力发展,受到了业界的欢迎。另一项引人注目的新基准是“人类最后考试”,它包含了3000道同行评审的多步骤问题,涵盖多个学科,试图在专家级推理上挑战AI系统。早期结果显示,OpenAI的模型在该测试发布一个月内就取得了26.6%的成绩,展现了AI的快速进步。
xAI 正式上线 Grok 3 API,一次性推出4种模型,以适配不同应用场景,定价策略灵活,用户可按需选择。同日,谷歌、Anthropic等也推出新的定价策略。 GenAI竞争,越来越激烈了。 据Similar ...
DeepMind报告:AGI或2030年问世,存人类灭绝风险。 近日,谷歌旗下DeepMind实验室最新发布了长达145页的人工智能安全报告,称具备人类智能水平的通用 ...
4月3日,上周,负责维护和管理 ARC-AGI 的 Arc Prize Foundation 对 OpenAI的 o3 “推理”人工智能模型在 ARC-AGI 基准测试中的成本估算进行了重大修订 ...
【新智元导读】OpenAI o3推理成本从3000美元飙至3万美元,暴增10倍。o3-high靠暴力试错生成4300万字解题,却被ARC-AGI「除名」。 短短几个月,最新评估显示,o3推理成本比预初估计暴涨10倍! 在ARC-AGI最新测试上,AI单次任务曾用3000美元,而如今已飙升至30000美元 ...
文丨《瞭望东方周刊》记者陈融雪 给AI测智商的尝试,本质上是一场人类认知框架的自我审视。 AI能有多聪明?2024年末,OpenAI宣布ChatGPT-o3在ARC-AGI(通用人工智能抽象和推理语料库)基准测试中取得157分,与爱因斯坦、霍金等人类顶尖智力标杆的推定智商比肩 ...
IT之家4 月 3 日消息,上周,负责维护和管理 ARC-AGI 的 Arc Prize Foundation 对 OpenAI 的 o3 “推理”人工智能模型在 ARC-AGI 基准测试中的成本估算进行了重大修订,现在看起来 o3 的运行成本没有那么低。 去年 12 月 OpenAI 推出 o3 模型时,与 ARC-AGI 的开发者合作,展示了 ...
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。7、Genspark发布自动化AI代理SuperAgent具备自主思考、调用工具的能力Genspark最近推出了其全新的自动化AI代理SuperAgent,凭借其强大的自主思考和任务执行能力,迅速成为行业的焦点。用户只需输入感兴趣的主题,系统便能� ...