缓存 - 搜索 News

来自MSN16 小时

标点符号成大模型训练神器！KV缓存狂减一半，可处理400万Tokens长 ...

SepLLM团队投稿量子位 | 公众号 QbitAI 文字中貌似不起眼的标点符号，竟然可以显著加速大模型的训练和推理过程？来自华为、港大、KAUST和马普所的研究者，就提出了一种新的自然语言建模视角——SepLLM。

17 小时

在这个数字化经济快速发展的时代，华为又一次引领了智能科技的新潮流。最近，华为推出了一项重大的AI技术突破—KV缓存减半。这一技术的问世，不仅在科技圈引起了广泛讨论，更吸引了乎所有人的眼球，尤其是对追求高性价比、实用手机的家庭用户们来说，这绝对是一个不容错过的技术消息。我们知道，针对当今市场，消费者对于性能和价格的要求越来越高，而华为在这方面的表现值得称道。

1 天

DeepSeek亮出降价“底牌”，545%的利润率意味着什么？

持续五天的“DeepSeek开源周”刚结束，DeepSeek团队就在国内知乎平台注册官方账户，并在3月1日当天发布了第一条动态。这篇最新的帖子首次对外公布模了型的优化技术细节、成本利润率等关键信息。

中华网4 天

降价潮开启！DeepSeek官宣，猛降75% 错峰时段更经济

降价潮开启！DeepSeek官宣，猛降75% ...

5 天

微软Copilot存重大数据泄露隐患，超2万GitHub仓库敏感信息面临风险

尽管微软在 2024 年 12 月停用了 Bing 缓存功能，但 Lasso 表示这只是临时解决方案，Copilot 仍能访问这些不应公开的数据。微软将此问题归类为“低风险”，称其缓存设定为“可接受”行为。

5 天

Kimi组队清华获得FAST2025最佳论文奖

2月26日，Kimi与清华大学合作研发的Mooncake项目技术报告获得计算机存储领域顶会FAST 2025最佳论文奖。Mooncake是月之暗面Kimi的底层推理服务平台，核心是以KVCache为中心的全局缓存和调度器，旨在在严格的延迟相关服务级别目标（SLOs）下最大化吞吐量。（第一财经记者吕倩） ...

12 天

AMD "Strix Halo" 处理器芯片结构确认：引入新型互联，保留 3D 缓存接口

其中在 CCD 部分，AMD 大体上复用了桌面端锐龙 9000 "Granite Ridge" 处理器的 CCD 核心区域 IP 设计，因此 "Strix Halo" 芯片保留了用于 3D V-Cache 集成的 TSV 接口引脚。

太平洋电脑网13 天

月之暗面推出新模型Kimi Latest 支持自动上下文缓存

据悉，月之暗面宣布推出了一款名为Kimi Latest的新模型。该模型将与Kimi智能助手产品同步升级，并始终使用最新的Kimi大模型。其特点包括上下文长度128k、可选择8k/32k/128k计费模型以及支持自动上下文缓存。不过目前仅支持调用普通版模型，长思考模型尚不支持API调用。

快科技15 天

AMD Zen6升级单CCD 12核心！两个CCD终于可以直连

锐龙的CCD一直是都是单个8核心设计，这一次终于升级12核心，三级缓存将顺应地从32MB增加到48MB，因此我们将会在主流桌面上看到24核心型号。

搜狐25 天

SSD 缓存加速秘籍：群晖NAS 随机读性能提升 40 倍实操

不过，就算是再厉害的硬件平台，面对大规模数据读写需求时，也难免会 “掉链子”，遭遇性能瓶颈。这时候，SSD 缓存技术就像一位超级英雄，闪亮登场，为群晖 NAS 的性能提升开启了一条 “超车道”。今天，咱就来好好唠唠如何借助 SSD 缓存给群晖 NAS 加速 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果