Swe - 搜索 News

10 天

在近期的AI科技圈中，一则引人注目的消息瞬间点燃了行业热情。OpenAI发布并开源了全新标准化评估基准——SWE-Lancer，这个基准旨在测试大型AI模型的编码能力。它的发布覆盖了来自全球著名自由职业平台Upwork的1400多个软件工程任务，总价 ...

2025-02-07 13:22发布于北京新智元官方账号【新智元导读】2025年，软件工程要彻底变天了。先有奥特曼预言，后有微软下场All in智能体。刚刚，首个自主SWE智能体面世，不仅会主动改bug修复错误，还能自主提交PR评论。

凤凰网科技讯 ...

1 天

那么，BBEH 究竟有多难呢？当前能力最强的 o3-mini (high) 得分也仅有 44.8 分，不及格。而其它被测模型的得分均不超过 10 分！DeepSeek-R1 仅有 6.8，谷歌自家的 Gemini-2.0-Flash 也只有 ...

来自MSN10 天

品玩2月19日讯，OpenAI 官方宣布，推出一款全新的大模型测试基准SWE-Lancer，主要用于评测大模型的编程能力。

2月19日消息，美东时间2月18日收盘，Intel股价大涨16.06%，创2024年8月1日以来收盘新高。美国副总统万斯表示，美国政府将保障最强大的AI芯片在美国设计与生产，吸引投资者购买Intel股票。Intel是美国唯一能生产高端AI芯片的企业， ...

1 天

GPT-4.5的定价策略引起了广泛关注，其API调用价格定为每100,000个tokens 75美元，远高于竞争对手DeepSeek的每100,000个tokens ...

19 小时

美国AI芯片出口管制新规的落地，推动了我国算力芯片国产替代的加速。尽管存在美国的算力壁垒，DeepSeek仍然以有限算力和训练成本实现了高性能表现，这一成功有望进一步激发国产算力潜能，国产AI芯片企业对于DeepSeek的支持也有望带动算力国产化进程 ...

1 天on MSN

当地时间2月27日，OpenAI发布了最新模型GPT-4.5的研究预览版。这是一款通用型大语言模型，其定位并非OpenAI最顶尖的模型，但却号称“情商最高”，且API调用价高于其主流模型GPT-4o。

钛媒体APP on MSN21 小时

这才是OpenAI对抗DeepSeek压力的一记还击。之前将推理模型下放给免费用户只是小打小闹，北京时间2月28日凌晨4点，OpenAI震撼发布GPT-4.5。 OpenAI CEO山姆·奥特曼（Sam ...

一些您可能无法访问的结果已被隐去。