batch-size - 搜索 News

4 小时

也解释了为何DeepSeek可以影响英伟达的股价。因为通过系统优化，底层硬件的护城河没有那么深了。由此看到，H20这样原本不被大厂推崇的推理计算卡开始抢手。甚至更进一步，英伟达本身的地位也会受到影响。

为了实现这两个目标，DeepSeek使用大规模跨节点专家并行（Expert Parallelism / EP）。首先EP使得batch size大大增加，从而提高GPU矩阵乘法的效率，提高吞吐。其次EP使得专家分散在不同的GPU上，每个 GPU 只需要计算很少的专家（因此更少的访存需求），从而降低延迟。

腾讯网14 小时

生成AI的两大范式：扩散模型与Flow Matching的理论基础与技术比较

Flow Matching则构建噪声分布与数据分布间的连续路径（流）。这一过程可类比为定义一种平滑的转换计划，使随机噪声逐渐形成有结构的数据，如同观察一块黏土从无序状态被塑造成精细雕像的过程。

知乎专栏 on MSN18 天

DeepSeek-V3 / R1 推理系统概览

DeepSeek-V3 / R1 推理系统的优化目标是：更大的吞吐，更低的延迟。为了实现这两个目标，我们的方案是使用大规模跨节点专家并行（Expert Parallelism / EP）。首先 EP 使得 batch size 大大增加，从而提高 GPU 矩阵乘法的效率，提高吞吐。其次 EP 使得专家分散在不同的 GPU 上，每个 GPU ...

3 天

昇腾大EP：为大模型底座加装“新引擎”，让大模型应用驶入“快车道”

背后的原因在于，DeepSeek验证了模型性能与算力成本的“可解耦性”，不但为行业提供了降本增效的新范式，也加速了大模型从实验室走向产业端，更带动了行业智能化的进一步“走深向实”。

IT之家19 天

官方详解 DeepSeek-V3 / R1 推理系统：理论利润率达 545%

IT之家 3 月 1 日消息，DeepSeek 官方今日在知乎发布《DeepSeek-V3 / R1 推理系统概览》一文，详细介绍如何使用大规模跨节点专家并行（Expert Parallelism / EP）来增大 batch size，如何隐藏传输的耗时，如何进行负载均衡。官方表示，DeepSeek-V3 / R1 推理系统的优化目标是更 ...

来自MSN19 天

DeepSeek突袭公布成本利润率：545%

鱼羊编辑整理量子位 | 公众号 QbitAI 五连开源后，DeepSeek还有One More Thing！就在刚刚，DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。重点包括，优化吞吐量和延迟的方法：跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计：每个H800节点每秒有73.7k/14.8k个输入/输出token 成本利 ...

腾讯网1 天

【行业资讯】Git for Windows v2.49.0 发布

Git for Windows v2.49.0 现已发布。公告指出，由于持续的维护挑战以及社区的参与和使用有限，Git for Windows 中的 git svn 支持将在未来几个月内逐步淘汰。Git for Windows v2.48.1 是最后一个附带 i686（“32 位”）安装程序、portable Git 和 archive 的版本。未来版本将仅构建 32 位 MinGit，直到 20 ...

3 天

算力革命再升级昇腾大EP如何重塑AI推理效率边界

昇腾大EP解决方案凭借多项关键技术有效解决了以上挑战，针对专家负载不均的难题，通过自动寻优、自动配比、自动预测、自动降解，实现备份节点和副本专家灵活可扩展、高可用和极致均衡。

2 天

DeepSeek让英伟达H20都被疯抢涨价10万的那种

最近有市场消息称，原本不受青睐的英伟达H20咨询量暴涨几十倍，8卡H20机器的价格也较年前涨价十万（单价110万左右），有从业者预测“价格不会下来了”。 AI ...

腾讯网9 天

EP架构：DeepSeek突破性实践背后，分布式推理的终极形态之争

作者 | PPIO 派欧云推理加速团队DeepSeek MoE 架构采用跨节点专家并行（EP）架构，当 DeepSeek MoE 以 EP320 架构在解码阶段实现惊人的批处理规模时，整个 AI ...

腾讯网19 天

高达545%、可日赚346万元！DeepSeek首次披露成本利润率

3月1日，DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章，全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是，文章首次披露了DeepSeek的理论成本和利润率等关键信息。DeepSeek ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果