IT之家 3 月 3 日消息,科大讯飞今日宣布星火 X1 升级,并发布星火一体机等系列新品。 其中,深度推理大模型星火 X1 再升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1。
科大讯飞表示,此次升级在数学答题效果上全面提升,尤其是应对竞赛级难题表现显著。同时,星火 X1 在中小学数学作业的批改、辅导以及题目推荐等任务上也展现出了明显的优势。 测试集合来源:中文测试集来自 2023/2024 年各学段考试真题 / 模拟题 / ...
IT之家 2 月 27 日消息,Kimi 最新模型 k1.6 今日曝光。据全球动态基准测试平台 LiveCodeBench, Kimi k1.6 超过 GPT o3mini、o1 等模型 ,在代码生成测试中实现登顶。
9 天
来自MSNOpenAI 推出全新 AI 模型 o1 系列,引领复杂推理新时代2024 年 9 月 13 日,北京时间午夜,OpenAI 正式发布了一系列全新的大型语言模型(LLM),旨在专门解决复杂的推理问题。这些模型在科学、技术、工程和数学(STEM)领域表现卓越,标志着人工智能能力的重大飞跃。 OpenAI o1 ...
编译 | 郑丽媛出品 | CSDN(ID:CSDNnews)AI 大模型的能力,这几年来我们已经有目共睹——然而当 AI 面临失败时,它会怎么做呢?根据 Palisade Research 的最新研究显示,OpenAI 的 o1-preview 和 ...
本指南提供 ChatGPT 中文版使用指南,汇总国内可用的 ChatGPT镜像网站 和 官网使用教程 帮助您快速上手 ChatGPT,无论是个人使用还是专业需求,均可无限使用 ChatGPT-4、4o 和 o1! 为什么选择 ChatGPT 中文版? ChatGPT 中文版 是 OpenAI开发的 ChatGPT模型的中文优化版本 ...
OpenAI 的评估结果显示,包括自家 GPT-4o、o1 和 Anthropic Claude 3.5 Sonnet 在内的前沿模型仍然无法解决大多数任务。从下图中可以看到,Claude 3.5 Sonnet 完成的任务最多,并且挣到了最高的 ...
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!在医疗领域,大模型的应用和影响力正在不断扩大。但当前对于大模型在医疗任务中的评估主要 ...
在 ENIGMAEVAL 基准上,研究者对现有多模态和推理基准上表现优异的前沿语言模型进行了评估。结果显示,包括 OpenAI o1 在内等 SOTA 模型在普通谜题(Normal)上的准确率最高仅为 7.0% 左右,在困难谜题(Hard)上的准确率则降至 0%,远远不及经验丰富的人类解谜者。
GPT-4.5被认为是“华而不实”,其性能不值如此高的价格。如果OpenAI不能尽快推出一个性能显著提升的模型,关于其领先地位正在削弱的质疑声将会越来越大。
近日,科大讯飞在投资者关系活动记录中透露了关于星火X1新版本的重要进展。这一版本预计在3月内完成,目标是全面对标甚至超越OpenAI的o1模型,尤其是在数学答题和过程思维链能力上实现突破。通过与中国教科院等教育专家的合作,科大讯飞在教育领域展现了强大 ...
免费试用:提供初始免费额度,方便用户体验各项功能。 推荐的 ChatGPT 中文版镜像网站 chat.yixiaai.com:这是一个稳定运营近两年的ChatGPT中文版平台,支持 GPT-4、4o 和 o1 模型,有 AI绘画功能。chat.lify.vip:该ChatGPT镜像网站集成了最新的 ChatGPT模型,包括 GPT-4o、4o ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果