COT - 搜索 News

45 分钟

Long-CoT 后，推理模型的「思维模板」有哪些新玩法？

1、在推理模型的后训练中，以思维链（CoT）为代表的推理策略的核心在于类似提供一套「思维模板（Template）」，让模型将问题分解为逐步的中间推理步骤，逐步阐述解法，从而提升模型的推理能力。 [1-1] ...

2 小时

华人团队提出「CoD」草稿链，减少 80% Token，AI 省钱第一名！

在 AI 领域，大规模语言模型（LLMs）已经展示了强大的推理能力。这些模型通常生成长长的「思维链（Chain-of-Thought, CoT）」来逐步推导答案，好处显而易见，问题是计算成本和延迟高。

2 小时

华人团队创新「草稿链」技术，AI成本大幅降低80%！

在当前人工智能领域，降低AI成本无疑是技术发展的重要挑战。正如两个月前震撼科技界的DeepSeekR1模型，它不仅在成本上表现优异，其基于思维链（Chain-of-Thought, CoT）的推理流程更是备受关注。然而，生成长文本的CoT虽然帮助模型更好地推理，却同时带来了计算成本与延迟的增加。针对这一问题，最近Zoom的研究团队提出了一种全新的推理模式——草稿链（Chain-of-Draft, ...

1 天

只需7.6% token，性能还更强，华人团队提全新「草稿链」CoD，成本延迟 ...

LLM推理中的延迟问题常被忽视，而实时应用对此要求严苛。来自Zoom的华人团队提出草稿链（CoD）技术，仅用7.6%的token，就能在保持准确率的同时，大幅降低推理成本和延迟。

腾讯网2 天

新技术帮助大语言模型控制思维链长度，在不增加计算成本的情况下 ...

这种被称为长度受控策略优化 (LCPO) 的技术，可以在保证模型提供正确答案的同时，将其"思维"控制在预设的 token 预算内。实验表明，经 LCPO ...

3 天

OpenAI最强模型惨遭剖脑，CoT写下作弊自白书，不写代码耍心机被当场 ...

【导读】如今的前沿推理模型，学会出来的作弊手段可谓五花八门，比如放弃认真写代码，开始费劲心思钻系统漏洞！为此，OpenAI研究者开启了「CoT监控」大法，让它的小伎俩被其他模型戳穿。然而可怕的是，这个方法虽好，却让模型变得更狡猾了…… ...

3 天

原油预测：空头回补和WTI原油价差暗示反弹

错过一次，就可能与财富翻倍的机会擦肩而过！用ProPicks AI，提前布局，6种AI选股模型助你今年的投资大放异彩！仅2024年迄今的短短时间，ProPicks ...

至顶头条 on MSN4 天

AI能力的双刃剑：新研究揭示AI作弊行为及其掩盖证据

最新研究发现,生成式人工智能和大型语言模型存在两种不良行为:一是会作弊,二是会试图隐藏作弊证据。这种行为类似于犯罪后企图掩盖罪行,使情况更加恶劣。研究提醒我们,在使用AI时不仅要警惕其作弊行为,还要注意AI会竭尽全力阻止我们发现作弊的证据。这对于AI ...

红板报 on MSN4 天

自动调整推理链长度，SCoT来了！为激发推理能力研究还提出了一个新 ...

SCoT团队投稿量子位 | 公众号 QbitAI 不怕推理模型简单问题过度思考了，能动态调整CoT的新推理范式SCoT来了！ SCoT，即自结构化推理链（Self-structured Chain of Thought ）。它通过将推理过程分解为最小语义原子步骤，能动态生成适配不同复杂度问题的CoT结构，解决了现有方法在推理多样性和效率上的不足。另外，为了激发推理能力，研究人员还提出了Ato ...

汇通财经6 天

COT报告：对欧元和日元的看多押注持续增加

汇通财经讯——大型投机者连续第二周将日元期货的净多头持仓推至历史新高，而欧元期货仅净空头1万份合约。

快科技18 天

响应小于1秒、唤醒识别超98%！岚图自研AI语音对话系统即将发布

岚图汽车的座舱AI技术研究目前集中在三个主要方向：深度优化整车智能座舱系统，提供便捷的用户体验；结合deepseek的CoT训练方案，增强系统的 ...

和讯网19 天

多家百亿量化加入AI战局！九坤携手微软复现，宽德发布AI人才招聘帖

近日，量化巨头九坤携手微软团队成功复现DeepSeek-R1。复现成功定义为：长思维链(Long CoT)能够自然涌现；跨领域ood泛化，比如在数学题上有显著提升。该团队在网上公开了论文，主要由微软亚洲研究院、九坤投资和其他独立人员合著。据了解，该团队还首次发现 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果