百度声称这两款模型在多个评测指标上达到了领先水平,在多项第三方基准测试中超越了 DeepSeek 的非推理型 V3 模型和 OpenAI 的 GPT-4.5(注意百度选择的这个相似的命名)。这些测试包括 C-Eval (评估中文大语言模型在 52 个学科领域的知识和推理能力)、CMMLU (中文大规模多任务语言理解) 和 GSM8K (数学应用题)。
百度的长期计划是将ERNIE 4.5和ERNIE X1逐步整合进其整个产品生态系统。在百度搜索、文小言APP等产品中,这些模型将被深度应用,从而为用户提供更加丰富、多样化的体验。例如,用户在搜索信息时,ERNIE 4.5将能够更准确地捕捉用户意图,而ERNIEX1将在做出复杂决策时提供日志和推理支持。
文心大模型4.5已同步上线,约为GPT4.5价格的1%,输入价格为0.004元/千tokens,输出0.016元/千tokens ;文心大模型X1定价为输入0.002元/千tokens,输出0.008元/千tokens,即将在千帆平台上线。
两年前的同一天,百度以 “全球首个大厂生成式 AI” 的身份发布文心一言,开启了中国大模型的元年;今天,4.5 版本带着 “原生多模态”“深度思考” 的标签如期而至,同步上线的还有对标 DeepSeek-R1 的 X1 模型 —— 这场迟到的 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果