token - 搜索 News

1 天

只需7.6% token，性能还更强！华人团队提全新「草稿链」CoD，成本延迟 ...

【新智元导读】LLM推理中的延迟问题常被忽视，而实时应用对此要求严苛。来自Zoom的华人团队提出草稿链（CoD）技术，仅用7.6%的token，就能在保持准确率的同时，大幅降低推理成本和延迟。

只需7.6% token，性能还更强！华人团队提出全新「草稿链」CoD，成本 ...

1. Zoom的华人研究团队提出了一种名为草稿链（CoD）的技术，仅使用7.6%的token，就能在保持准确率的同时，大幅降低推理成本和延迟。 2. CoD技术灵感来源于人类解决复杂问题的方式，通过限制每个推理步骤最多五个词，使模型专注于最关键的信息 ...

4 天

1.5B硬刚GPT-4o，CMU祭出LCPO提示可控思考！每token性能较S1暴涨2倍

【新智元导读】CMU团队用LCPO训练了一个15亿参数的L1模型，结果令人震惊：在数学推理任务中，它比S1相对提升100%以上，在逻辑推理和MMLU等非训练任务上也能稳定发挥。更厉害的是，要求短推理时，甚至击败了GPT-4o——用的还是相同的toke ...

8 天

AI话痨终结者！UCSD清华提出「思维扫描术」Dynasor-CoT，推理巨省token

【新智元导读】 ...

3 天

全新CoD颠覆推理范式，准确率接近但token消耗成倍降低

如今，OpenAI o1 和 DeepSeek R1 等推理模型的发展，显著提升了思维链 (CoT) 之类的技术在大语言模型 (LLM) ...

财联社 on MSN9 天

大模型Token流量激增33倍！生成式AI或成未来网络流量的主力军

“随着人工智能的发展，运营商有望迎来更多机遇，未来网络流量的很大部分会来自于生成式AI的Token。”华为无线网络产品线副总裁、首席营销官赵东在采访中认为，“根据我们的预测，未来五年后，产生的流量将是现有日均流量的5倍以上。” ...

腾讯网3 天

1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区？

幻觉、知识滞后是一个老生常谈的话题，现在模型基本上都已经具备 RAG 联网能力，或者通过人类反馈强化学习（RLHF）优化生成逻辑来缓解；为了让模型多记住点东西，增大上下文长度也是这两年各大厂商卷的方向，硬是被谷歌卷到了 2M 的天花板。

来自MSN15 天

AI产品经理红宝书：深入浅出token（3）

本系列会继续用通俗易懂的语言深入浅出为小白介绍AI知识，尤其是近年火起来的大模型、AIGC、Agent等内容，本章节内容尝试用生活中的场景解释一下使用大模型要关注的“token”。 01 Token是什么？大模型感知世界的元素 Token是大语言模型处理文本的最小信息单元，相当于模型理解世界的“基本构件”。当模型处理输入时，文本会通过分词器（Tokenizer）被切割成一系列Token，这些To ...

人民网 on MSN8 天

华为杨超斌：中国AI产生的Token流量暴增，预计到2030年全网日均消耗 ...

华为高级副总裁、ICT销售与服务总裁李鹏在MWC25期间演讲时表示，5G-A与AI相伴相生，将给运营商的DOU（平均每户每月上网流量）与ARPU（每用户平均收入）带来双位数的增长。

知乎专栏 on MSN8 天

从DeepSeek infra报告联想：Token产能与经济危机

马克思曾预言经济危机源于产能过剩，过去我对此不以为然，认为产能过剩只是表象，经济危机更多源于投资过热或需求不足，导致投资收益小于风险。（注，评论区指出这句话不符合马克思主义原理。我深刻反省，但我确实不太懂马原，所以不知道怎么修改，就不修改原文了，只在此处注明） ...

腾讯网10 天

华为杨超斌：近8个月国内AI大模型Token所带来的流量增长了33倍

【华为杨超斌：近8个月国内AI大模型Token所带来的流量增长了33倍】《科创板日报》4日讯，华为董事、ICT BG CEO杨超斌表示，在过去8个月里面，中国市场AI产生的Token所带来的流量增长了33倍，其中15倍是来自于付费的Token。自从DeepSeek出来以后，在中国市场每Token的价格下降了97%。预计到2030年，中国市场因为Token带来的网络流量的增加，将会达到每天500T ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果