缓存 - 搜索 News

来自MSN11 小时

标点符号成大模型训练神器！KV缓存狂减一半，可处理400万Tokens长 ...

SepLLM团队投稿量子位 | 公众号 QbitAI 文字中貌似不起眼的标点符号，竟然可以显著加速大模型的训练和推理过程？来自华为、港大、KAUST和马普所的研究者，就提出了一种新的自然语言建模视角——SepLLM。

什么值得买 on MSN10 小时

飞牛OS中的内存缓存太多了？：这不是问题，而是解决方案

最近在NAS交流群中，我注意到有人对飞牛OS的内存占用情况忧心忡忡。有人发截图抱怨："系统吃了我10GB内存，这不正常吧？"，然 ...

腾讯网3 天

可降低GPU内存的推理框架面世：韩国团队通过卸载键值缓存节约英伟 ...

DeepSeek 通过工程手段实现了 GPU 的良好利用，这一做法似乎引起了全球 AI 研究人员的共鸣。近日，来自韩国科学技术院和 DeepAuto.ai 公司的研究人员，研发出一款名为 InfiniteHiP ...

5 天

篆芯半导体获芯片缓存调度专利，推动AI技术创新

2025年2月26日，篆芯半导体（南京）有限公司正式公告其获得了一项名为“一种芯片缓存调度方法和系统”的专利。这一消息引发了业内的广泛关注，标志着篆芯半导体在芯片技术领域取得了重要进展，为未来AI及高性能计算的发展奠定了基础。

20 小时

微信新功能助力手机瘦身，AI技术助你高效管理存储空间

近日，微信推出了一项备受期待的新功能，帮助用户更高效地管理手机存储空间。在‘我-设置-通用-存储空间’界面中，用户可以更直观地清理缓存中的原图和原视频，从而腾出更多空间。这一功能的推出，不仅解决了用户‘图片已过期’的烦恼，也为手机瘦身提供了新的解决方 ...

1 天

DeepSeek亮出降价“底牌”，545%的利润率意味着什么？

持续五天的“DeepSeek开源周”刚结束，DeepSeek团队就在国内知乎平台注册官方账户，并在3月1日当天发布了第一条动态。这篇最新的帖子首次对外公布模了型的优化技术细节、成本利润率等关键信息。

5 天on MSN

微星泰坦18 Pro震撼发布：搭载锐龙9 9955HX3D，144MB缓存性能爆棚！

微星于近日隆重举办了一场新品发布会，正式推出了其备受期待的泰坦、雷影及绝影系列游戏本，全面拥抱新一代平台技术。在这些新品中，泰坦系列凭借其丰富的型号选择和旗舰级的配置，尤为引人注目。本文将重点介绍泰坦18 Pro AI 2025与泰坦18 ...

51CTO3 天

绕过 RAG 实时检索瓶颈，缓存增强生成（CAG）如何助力性能突破 ...

传统 RAG 方案中的检索延迟、准确性波动以及系统复杂度，都在考验着开发者的耐心和智慧。缓存增强生成（CAG）技术巧妙地利用了新一代大语言模型处理长上下文的能力，通过预加载文档和预计算 KV 缓存，消除了实时检索的需求。实验结果表明，在可管理的 ...

5 天

微星发布泰坦18 Pro游戏本：首发锐龙9 9955HX3D、144MB海量缓存

快科技2月26日消息，微星今天举办新品发布会，推出了新一代泰坦、雷影、绝影系列游戏本，全面升级新平台，其中泰坦系列作为旗舰本，型号最为丰富，这里来看一下泰坦18 Pro AI 2025、泰坦18 Pro锐龙版2025。

51CTO6 天

LLM高效推理：KV缓存与分页注意力机制深度解析

随着大型语言模型（LLM）规模和复杂性的持续增长，高效推理的重要性日益凸显。KV（键值）缓存与分页注意力是两种优化LLM推理的关键技术。本文将深入剖析这些概念，阐述其重要性，并探讨它们在仅解码器（decoder-only）模型中的工作原理。随着大型语言模型 ...

电子工程专辑4 天

第一款AMDZen5X3D游戏本诞生！144MB海量缓存搭档RTX5090

泰坦18 Pro锐龙版2025则是首发锐龙9 9955HX3D，16核心32线程，最高频率5.4GHz，并集成3D缓存，L2+L3+3D合计多达144MB。据悉，ROG魔霸9系列、机械革命曙光16 Pro，也都会配备锐龙9 9955HX3D。两款泰坦18 Pro的其他配置几乎一模一样，比如显卡都是可选RTX 5090或者RTX 5080 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果