token - 搜索 News

2 天

只需7.6% token，性能还更强！华人团队提全新「草稿链」CoD，成本延迟 ...

【新智元导读】LLM推理中的延迟问题常被忽视，而实时应用对此要求严苛。来自Zoom的华人团队提出草稿链（CoD）技术，仅用7.6%的token，就能在保持准确率的同时，大幅降低推理成本和延迟。

1 天

随着人工智能技术的迅猛发展，AI大模型如ChatGPT等已成为公众关注的焦点。这些看似神秘、具有人性特征的创作行为背后，却埋藏着严谨的机械逻辑和复杂的技术架构。本文深入探讨AI大模型的内部运作机制，揭示Chat的实际含义、大型语言模型LLM的本质、Token如何计算、以及蒸馏模型的重要性，全方位解析大模型背后的秘密。

腾讯网2 天

只需7.6% token，性能还更强！华人团队提出全新「草稿链」CoD，成本 ...

1. Zoom的华人研究团队提出了一种名为草稿链（CoD）的技术，仅使用7.6%的token，就能在保持准确率的同时，大幅降低推理成本和延迟。 2. CoD技术灵感来源于人类解决复杂问题的方式，通过限制每个推理步骤最多五个词，使模型专注于最关键的信息 ...

4 天

全新CoD颠覆推理范式，准确率接近但token消耗成倍降低

如今，OpenAI o1 和 DeepSeek R1 等推理模型的发展，显著提升了思维链 (CoT) 之类的技术在大语言模型 (LLM) ...

6 天

15B硬刚GPT-4o，CMU祭出LCPO提示可控思考！每token性能较S1暴涨2倍

【新智元导读】 ...

腾讯网5 天

1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区？

幻觉、知识滞后是一个老生常谈的话题，现在模型基本上都已经具备 RAG 联网能力，或者通过人类反馈强化学习（RLHF）优化生成逻辑来缓解；为了让模型多记住点东西，增大上下文长度也是这两年各大厂商卷的方向，硬是被谷歌卷到了 2M 的天花板。

腾讯网1 天

苏妈击溃英特尔再战英伟达，市值飙至1600亿！AMD怪兽完爆4090 7.3倍

新智元报道编辑：编辑部 ...

至顶头条 on MSN1 天

新技术帮助大语言模型控制思维链长度，在不增加计算成本的情况下 ...

研究人员提出了一种名为长度控制策略优化(LCPO)的训练技术，可以让开发者更好地控制大语言模型的思维链长度。这种方法通过在训练过程中引入长度约束，使模型能够在保持准确性的同时生成更简洁的推理过程。实验表明，采用LCPO训练的模型在准确性和成本之间提供 ...

GitHub2 天

同一主域名下的cookie浏览器会自动传递给服务端

在计算机中，尤其是在网络应用中，称为“会话控制”。Session对象存储特定用户会话所需的属性及配置信息。这样，当用户在应用程序的Web页之间跳转时，存储在Session对象中的变量将不会丢失，而是在整个用户会话中一直存在下去。当用户请求来自应用程序的 ...

中国共产党新闻网2 天

跟着总书记上两会 | 见证

“希望降低家庭的生育、养育、教育成本”“加强老年医疗健康服务的基层社区覆盖力度”“完善社会保障体系，减少后顾之忧”…… “梦虽遥，追则能达；愿虽艰，持则可圆。”站在新的历史坐标上，我，就是见证这一切的“第一人称”。

至顶头条 on MSN1 天

Cohere 发布仅需两块 GPU 的低成本 AI 模型

Cohere 推出新型大语言模型 Command A，具有高性能且硬件需求低。该模型性能超越 GPT-4o 和 DeepSeek-V3，仅需两块 GPU 即可运行。它拥有更大的上下文窗口，处理速度更快，专为企业级 AI 代理设计，可与 Cohere ...

品玩 on MSN2 天

Trae 接入硅基流动 SiliconCloud

品玩3月14日讯，据硅基流动官方消息，字节跳动旗下的中国首个 AI 原生集成开发环境（AI IDE）现已接入硅基流动 SiliconCloud 平台作为模型提供方。据悉，Tare现在支持支持用户通过 API 密钥（API ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果