SWE - 搜索 News

10 天

在近期的AI科技圈中，一则引人注目的消息瞬间点燃了行业热情。OpenAI发布并开源了全新标准化评估基准——SWE-Lancer，这个基准旨在测试大型AI模型的编码能力。它的发布覆盖了来自全球著名自由职业平台Upwork的1400多个软件工程任务，总价 ...

腾讯网22 天

微软官宣All in智能体，SWE Agent首曝光！奥特曼预警2025编程巨变

2025-02-07 13:22发布于北京新智元官方账号【新智元导读】2025年，软件工程要彻底变天了。先有奥特曼预言，后有微软下场All in智能体。刚刚，首个自主SWE智能体面世，不仅会主动改bug修复错误，还能自主提交PR评论。

腾讯网7 小时

5分钟顶人类8小时！OpenAI Deep Research订阅全推送，端到端强化微调是关键

【新智元导读】最近，OpenAI的研究团队在采访中表示，全新的Deep Research功能，可以为你节省几个小时甚至几天的时间！ Deep Research（深度研究）是继「Operator」之后，OpenAI推出的第二个智能体，利用模型的推理能力 ...

凤凰网1 天

OpenAI“最大最贵”大模型GPT-4.5，价格是DeepSeek的300倍

凤凰网科技讯（作者/陈俊熹）2月28日，OpenAI正式发布最新模型GPT-4.5研究预览版，这是一款号称“情商最高”的通用大语言模型。然而，其高达每100万tokens输入75美元的API调用价格，相比GPT-4o的2.5美元，暴涨了30倍，令人咋舌。可以作为对比的是，deepseek-chat正常时段每100万tokens输入的API调用价格为0.5美元，错峰时段（北京时间00:30-08 ...

虎嗅网9 天

Intel股价单日暴涨16% 10天累涨40%创半年来新高；OpenAI 推出大模型测试 ...

2月19日消息，美东时间2月18日收盘，Intel股价大涨16.06%，创2024年8月1日以来收盘新高。美国副总统万斯表示，美国政府将保障最强大的AI芯片在美国设计与生产，吸引投资者购买Intel股票。Intel是美国唯一能生产高端AI芯片的企业， ...

1 天

GPT-4.5震撼发布：智商情商双在线，价格也随之飙升

近日，人工智能领域迎来了一项重大突破。北京时间2月28日凌晨，OpenAI正式发布了备受瞩目的GPT-4.5模型。这一全新模型不仅在智商上更上一层楼，情商方面也有了显著提升，为AI与人类的交互开辟了新的可能性。

来自MSN10 天

OpenAI 推出大模型测试基准 SWE-Lancer

品玩2月19日讯，OpenAI 官方宣布，推出一款全新的大模型测试基准SWE-Lancer，主要用于评测大模型的编程能力。

1 天

谷歌发布BIG-Bench超难基准：DeepSeek-R1得分6.8，只有o3-mini超过10分

那么，BBEH 究竟有多难呢？当前能力最强的 o3-mini (high) 得分也仅有 44.8 分，不及格。而其它被测模型的得分均不超过 10 分！DeepSeek-R1 仅有 6.8，谷歌自家的 Gemini-2.0-Flash 也只有 ...

来自MSN5 小时

GPT-4.5震撼发布：智商高情商高，价格更高

本文来自微信公众号：直面AI，作者：毕安娣，编辑：王靖，题图来自：视觉中国这才是OpenAI对抗DeepSeek压力的一记还击。之前将推理模型下放给免费用户只是小打小闹，北京时间2月28日凌晨4点，OpenAI震撼发布GPT-4.5。

1 天on MSN

OpenAI“高情商”模型GPT-4.5发布，定价高过GPT-4o

当地时间2月27日，OpenAI发布了最新模型GPT-4.5的研究预览版。这是一款通用型大语言模型，其定位并非OpenAI最顶尖的模型，但却号称“情商最高”，且API调用价高于其主流模型GPT-4o。

钛媒体APP on MSN1 天

GPT-4.5震撼发布！OpenAI想证明“大力出奇迹”的叙事没有被打破

这才是OpenAI对抗DeepSeek压力的一记还击。之前将推理模型下放给免费用户只是小打小闹，北京时间2月28日凌晨4点，OpenAI震撼发布GPT-4.5。 OpenAI CEO山姆·奥特曼（Sam ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果