token - 搜索 News

至顶头条 on MSN1 天

研究人员提出了一种名为长度控制策略优化(LCPO)的训练技术，可以让开发者更好地控制大语言模型的思维链长度。这种方法通过在训练过程中引入长度约束，使模型能够在保持准确性的同时生成更简洁的推理过程。实验表明，采用LCPO训练的模型在准确性和成本之间提供 ...

1 天

揭秘AI大模型：从ChatGPT到Token的全方位解析

随着人工智能技术的迅猛发展，AI大模型如ChatGPT等已成为公众关注的焦点。这些看似神秘、具有人性特征的创作行为背后，却埋藏着严谨的机械逻辑和复杂的技术架构。本文深入探讨AI大模型的内部运作机制，揭示Chat的实际含义、大型语言模型LLM的本质、Token如何计算、以及蒸馏模型的重要性，全方位解析大模型背后的秘密。

腾讯网1 天

苏妈击溃英特尔再战英伟达，市值飙至1600亿！AMD怪兽完爆4090 7.3倍

新智元报道编辑：编辑部 ...

品玩 on MSN2 天

Trae 接入硅基流动 SiliconCloud

品玩3月14日讯，据硅基流动官方消息，字节跳动旗下的中国首个 AI 原生集成开发环境（AI IDE）现已接入硅基流动 SiliconCloud 平台作为模型提供方。据悉，Tare现在支持支持用户通过 API 密钥（API Key）接入平台中的DeepSeek-R1 & V3、QWQ-32B、Qwen2.5-Coder 等多款适合编码的模型，满足用户多样化模型使用需求。 SiliconCloud ...

腾讯网2 天

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

机器之心报道编辑：杜伟、陈陈大语言模型（LLM）在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力，比如 OpenAI 的 o1 系列。通常来说，这些方法在训练模型时可以产生比典型正确解决方案更长的轨迹，并包含了试图实现某些「算法」的 ...

2 天

只需7.6% token，性能还更强！华人团队提全新「草稿链」CoD，成本延迟 ...

LLM推理中的延迟问题常被忽视，而实时应用对此要求严苛。来自Zoom的华人团队提出草稿链（CoD）技术，仅用7.6%的token，就能在保持准确率的同时，大幅降低推理成本和延迟。当下，企业正处于部署AI的关键节点。

中国共产党新闻网2 天

跟着总书记上两会 | 见证

“希望降低家庭的生育、养育、教育成本”“加强老年医疗健康服务的基层社区覆盖力度”“完善社会保障体系，减少后顾之忧”…… “梦虽遥，追则能达；愿虽艰，持则可圆。”站在新的历史坐标上，我，就是见证这一切的“第一人称”。

4 天

全新CoD颠覆推理范式，准确率接近但token消耗成倍降低

如今，OpenAI o1 和 DeepSeek R1 等推理模型的发展，显著提升了思维链 (CoT) 之类的技术在大语言模型 (LLM) ...

5 天

西湖大学发布新智能体AppAgentX

西湖大学AGI实验室张驰团队日前推出AppAgentX——一款具备自我进化能力的GUI代理。据介绍，它能够在不断执行任务的过程中学习并优化自身的行为模式，实现更加高效的操作。从实验结果来看，AppAgentX从单步的执行效率到总体的API token消耗，在多个GUI交互任务上展现出了显著的“降本增效”。 (界面新闻) ...

每经网9 天

33倍流量狂飙！AI Token如何重塑中国网络格局？华为揭秘未来十年商业 ...

如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权，严禁转载或镜像，违者必究。

9 天

70TiB/s性能爆发！NVFile并行存储革新AI基础设施，助力DeepSeek R1大模型训练

DeepSeek R1 ...

每经网9 天

中国AI Token狂飙33倍！流量爆炸式增长，这是下一个商业风口吗？

在2025世界移动通信大会（MWC 2025）上，华为董事、ICT ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果