KV - 搜索 News

4 天

优于o1预览版，推理阶段KV缓存缩减一半，LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的能力，例如 o1 已能生成长度高达 100K tokens 的序列。然而，这也给 KV cache 的存储带来了严峻挑战。为应对这一难题，“hybrid model” ...

腾讯网1 天

为列宁格勒的KV系列坦克提供的燃料容器

因此，1941年7月底到8月初，开始出现配备了6到8个额外燃料箱的 KV-1 。这些坦克通常还配备了加厚的炮塔，分别来自伊治尔工厂和371工厂（列宁格勒机械制造厂）。这些燃料箱并非每辆K V坦克都有，部分坦克最初并未安装额外燃料箱。

8 天

原创苏联KV-1是“美国现代坦克之母”？美国故意隐藏了1942年一段史实

苏联KV-1重型坦克是美国“现代坦克之母”？这个观点不是天方夜谭，二战后期的M26重型坦克和M24轻型坦克，不少关键技术都来自KV-1的启发。这两种坦克也是美国现代坦克的开端。

13 天

原创苏军“怪兽”成纳粹德军噩梦：我们在50米外开炮，苏军直接不 ...

相信很多读者一定听说过纳粹德国的虎式重型坦克，作为一个史无前例的巨无霸，它一度成为所有盟军坦克的危险对手，在1937年开始研发，从1942年正式服役。实际上，俄国人的重型坦克，却要来得更早一些。

15 天

涉嫌窃取Nexon游戏机密，《Project KV》开发商遭韩国警方调查

而回到眼下针对Dynamis One的诉讼，据韩联社新闻报道称，早在朴炳林等人离职时，Nexon就发现未公开项目有数据泄露的迹象，去年便向警方报了案。警方则计划以扣押资料为基础，重点调查Dynamis One是否试图将窃取的数据确实应用于游戏开发，不过报道没有提到这些泄露资料和《Project KV》有何关联。

腾讯网2 天

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成

实验数据显示，在LLaMA3.1-8B模型下，传统AR生成10万Token约需4.9小时，而使用TOKENSWIFT后仅需90分钟，大幅节省时间。在Qwen2.5-14B时，传统AR生成10万Token更是达到了7.9小时，加速后仅需142分钟。这一成果对于实际应用中需要实时或高效长文本生成的场景具有重要意义。