batch-size - 搜索 News

4 小时

DeepSeek让英伟达H20都被疯抢，但AI推理爆发不只靠囤卡

也解释了为何DeepSeek可以影响英伟达的股价。因为通过系统优化，底层硬件的护城河没有那么深了。由此看到，H20这样原本不被大厂推崇的推理计算卡开始抢手。甚至更进一步，英伟达本身的地位也会受到影响。

腾讯网14 小时

生成AI的两大范式：扩散模型与Flow Matching的理论基础与技术比较

Flow Matching则构建噪声分布与数据分布间的连续路径（流）。这一过程可类比为定义一种平滑的转换计划，使随机噪声逐渐形成有结构的数据，如同观察一块黏土从无序状态被塑造成精细雕像的过程。

3 天

昇腾大EP：为大模型底座加装“新引擎”，让大模型应用驶入“快车道”

背后的原因在于，DeepSeek验证了模型性能与算力成本的“可解耦性”，不但为行业提供了降本增效的新范式，也加速了大模型从实验室走向产业端，更带动了行业智能化的进一步“走深向实”。

腾讯网1 天

【行业资讯】Git for Windows v2.49.0 发布

Git for Windows v2.49.0 现已发布。公告指出，由于持续的维护挑战以及社区的参与和使用有限，Git for Windows 中的 git svn 支持将在未来几个月内逐步淘汰。Git for Windows v2.48.1 是最后一个附带 i686（“32 位”）安装程序、portable Git 和 archive 的版本。未来版本将仅构建 32 位 MinGit，直到 20 ...

3 天

算力革命再升级昇腾大EP如何重塑AI推理效率边界

昇腾大EP解决方案凭借多项关键技术有效解决了以上挑战，针对专家负载不均的难题，通过自动寻优、自动配比、自动预测、自动降解，实现备份节点和副本专家灵活可扩展、高可用和极致均衡。

2 天

DeepSeek让英伟达H20都被疯抢涨价10万的那种

最近有市场消息称，原本不受青睐的英伟达H20咨询量暴涨几十倍，8卡H20机器的价格也较年前涨价十万（单价110万左右），有从业者预测“价格不会下来了”。 AI ...

腾讯网4 天

大模型推理系统优化浪潮下，昇腾大规模跨节点专家并行集群推理有 ...

近年来，大模型领域呈现百花齐放的态势，自OpenAI推出GPT-3以来，国内外众多企业纷纷投身其中，掀起了一场“百模大战”。xAI、谷歌、微软、百度、科大讯飞、智源、阿里巴巴、字节跳动等企业竞相发布各自的大模型，同时，DeepSeek也作为一股新兴力 ...

4 天

昇腾大规模跨节点专家并行推理：引领大模型技术的优化浪潮

近年来，大模型领域像盛开的花朵一样多姿多彩，自OpenAI推出GPT-3以来，全球各大企业纷纷进入，掀起了一场激烈的"百模大战"。xAI、谷歌、微软、百度、科大讯飞、阿里巴巴、字节跳动等公司如雨后春笋般相继推出自己的大模型，DeepSeek也作为新生力量脱颖而出。在这一波AI浪潮的推动下，大模型不仅仅局限于技术的成熟更新，更向着工程和实用的新方向迈进：一方面，企业开始关注更加高效、稳定、开放的平台 ...

3 天

谷歌重磅推出全新Scaling Law，抢救Transformer，3万亿美元AI面临岔路

对DiLoCo来说，这依然能保持不错的性能，还能一次性用更多资源，缩短总训练时间。而Data-Parallel似乎更依赖串行训练。这种训练时间的减少还因为通信量降低而加倍明显。

第一生活网3 天

中越界河免费精准期期中游项目在广西东兴试航

有观点认为，妙瓦（wǎ）底可（kě）能演变为（wèi）“第（dì）二（èr）个缅北”。对此，云（yún）南财经大（dà）学法政学院副院长简琨益（yì）向（xiàng）记者解释称，首先，相比缅北（běi），妙瓦底交通网络更加发达，军事实力更（gèng）强，犯罪园区规模更大（dà）、管理（lǐ）更严密。其次，妙瓦底的武装力量国际背景复杂，与东南亚很多犯罪组织都有勾结，多（duō）国犯罪集团联动，这是在 ...

4 天

谷歌重磅推出全新Scaling Law，智能的未来将是分布式的？3万亿美元AI ...

谷歌推出的DiLoCo分布式训练方法，其Scaling Law比数据并行更稳健、更优越、更高效、更强大，其模型规模越大优势越明显，有效解决通信瓶颈，为大模型训练开辟新可能。网友称DiLoCo可能会重新定义Scaling的方式。

天极网 on MSN4 天

AI普及加速度：昇腾大EP解决方案强势赋能

过去几年，业界普遍的观点认为，大模型的进步依赖于不断增加芯片资源的堆叠。而DeepSeek的横空出世以来，彻底改写了AI算力需求的游戏规则。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果