KV - 搜索 News

资讯

1 天

极客天成NVFile原生加速KV Cache：引爆DeepSeek推理新速度，显著缩短TTFT ...

LLM推理服务通常面临高并发请求,每个请求都需要独立、快速地访问其KV Cache。这对存储系统的并发处理能力、聚合带宽和延迟稳定性提出了严峻考验。NVFile的全栈并行架构确保了系统在高负载下依然能维持低TTFT和高吞吐: ...

18 小时

从 OpenAI 于 3 月 27 日宣布全面支持 MCP 协议开始，市面上的 MCP Server 数量，在不到一个月的时间里，逼近了 10,000 大关。接下来， Google 在 4 月 10 日为 Gemini 系列模型添加了对 MCP 协议的支持，称其为“AI Agent 时代的开放标准”，同时推出 A2A 协议（Agent-to-Agent Protocol）与 MCP 形成互补，聚焦 ...

2 天

苏系4.0权重KV-1S重型坦克，上期

苏系4.0权重KV-1S重型坦克，上期 ...

游侠网 on MSN18 天

《坦克世界》全新金币坦克——KV-4 T型

VIII KV-4 T型几乎汇集了KV系列坦克的所有亮点。它是一辆体积巨大的强劲坦克。该坦克全身遍布坚固的装甲。除此之外，它拥有KV-4系列坦克中最为可靠的炮塔。KV-4 T型完美地诠释了什么是“突击型重型坦克”。这头钢铁猛兽的重量险些超出了特惠商城的承受范围！快将这辆坦克收入麾下，其上架时间为：4月4日10:00至4月11日09:59！

11 小时

评分9.2，一天不如一天的大热IP竟然被一部4月新番盘活了？

虽然不被看好，人气排名第四，但它依然获得14万投票，无数人都想见证它的最后一舞。小栗帽在800米处开始发力反超，领跑，爆发出惊人的末脚，最后以以3/4马位夺冠，延续自己的传说。

腾讯网1 天

迈向长上下文视频生成！NUS团队新作FAR同时实现短视频和长视频预测 ...

本文由 NUS ShowLab 主导完成。第一作者顾宇超为新加坡国立大学 ShowLab@NUS 在读博士生，研究方向是视觉生成，在 CVPR、ICCV、NeurIPS 等国际顶级会议与期刊上发表多篇研究成果。第二作者毛维嘉为新加坡国立大学 ...

1 天

连接市场，拓展视界：励展博览集团发布“Hello China Hello World 2025 ...

导语：在全球经济面临诸多不确定性、贸易格局加速演变的当下，励展博览集团大中华区（以下简称“励展”）正式发布“Hello China Hello World ...

腾讯网1 天

腾讯、华为、微软、阿里专家齐聚一堂，共谈推理优化实践｜ AICon

在人工智能快速演进的浪潮下，大模型正加速重构各行业的技术底座，而推理性能优化正成为应对算力挑战、内存瓶颈与通信压力的关键突破口。当前，大模型推理性能优化主要围绕模型优化、推理加速与工程优化三大方向展开：通过模型量化、剪枝与蒸馏等手段降低计算复杂度、提 ...

红板报 on MSN22 天

10倍吞吐提升无损性能：多模态适用的KV cache量化策略来了，即插即用 ...

CalibQuant团队投稿量子位 | 公众号 QbitAI 在InternVL-2.5上实现10倍吞吐量提升，模型性能几乎无损失。最新1-bit多模态大模型KV cache量化方案CalibQuant来了。通过结合后缩放和校准方法，可显著降低显存与计算成本，无需改动原模型即可直接使用。即插即用、无缝集成多模态大语言模型在各种应用中展现出了卓越的性能。然而，它们在部署过程中的计算开销仍然 ...

18 小时

年报|巨亏7个亿，洗衣液第一股蓝月亮怎么了？

2024全年蓝月亮亏损约7.49亿港元，其中上半年亏损了6.6亿港元，占据全年亏损的88%。亏损的原因是在推广活动和广告上砸了巨资。2024年蓝月亮的销售及分销开支为50.49亿港元，相较2023年的32.44亿港元大幅增长55.6%。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果