batch-size - 搜索 News

4 小时

DeepSeek让英伟达H20都被疯抢，但AI推理爆发不只靠囤卡

也解释了为何DeepSeek可以影响英伟达的股价。因为通过系统优化，底层硬件的护城河没有那么深了。由此看到，H20这样原本不被大厂推崇的推理计算卡开始抢手。甚至更进一步，英伟达本身的地位也会受到影响。

腾讯网14 小时

生成AI的两大范式：扩散模型与Flow Matching的理论基础与技术比较

Flow Matching则构建噪声分布与数据分布间的连续路径（流）。这一过程可类比为定义一种平滑的转换计划，使随机噪声逐渐形成有结构的数据，如同观察一块黏土从无序状态被塑造成精细雕像的过程。

腾讯网1 天

【行业资讯】Git for Windows v2.49.0 发布

Git for Windows v2.49.0 现已发布。公告指出，由于持续的维护挑战以及社区的参与和使用有限，Git for Windows 中的 git svn 支持将在未来几个月内逐步淘汰。Git for Windows v2.48.1 是最后一个附带 i686（“32 位”）安装程序、portable Git 和 archive 的版本。未来版本将仅构建 32 位 MinGit，直到 20 ...

2 天

DeepSeek让英伟达H20都被疯抢涨价10万的那种

最近有市场消息称，原本不受青睐的英伟达H20咨询量暴涨几十倍，8卡H20机器的价格也较年前涨价十万（单价110万左右），有从业者预测“价格不会下来了”。 AI ...

第一生活网3 天

中越界河免费精准期期中游项目在广西东兴试航

有观点认为，妙瓦（wǎ）底可（kě）能演变为（wèi）“第（dì）二（èr）个缅北”。对此，云（yún）南财经大（dà）学法政学院副院长简琨益（yì）向（xiàng）记者解释称，首先，相比缅北（běi），妙瓦底交通网络更加发达，军事实力更（gèng）强，犯罪园区规模更大（dà）、管理（lǐ）更严密。其次，妙瓦底的武装力量国际背景复杂，与东南亚很多犯罪组织都有勾结，多（duō）国犯罪集团联动，这是在 ...

3 天

昇腾大EP：为大模型底座加装“新引擎”，让大模型应用驶入“快车道”

背后的原因在于，DeepSeek验证了模型性能与算力成本的“可解耦性”，不但为行业提供了降本增效的新范式，也加速了大模型从实验室走向产业端，更带动了行业智能化的进一步“走深向实”。

3 天

算力革命再升级昇腾大EP如何重塑AI推理效率边界

昇腾大EP解决方案凭借多项关键技术有效解决了以上挑战，针对专家负载不均的难题，通过自动寻优、自动配比、自动预测、自动降解，实现备份节点和副本专家灵活可扩展、高可用和极致均衡。

3 天

谷歌重磅推出全新Scaling Law，抢救Transformer，3万亿美元AI面临岔路

对DiLoCo来说，这依然能保持不错的性能，还能一次性用更多资源，缩短总训练时间。而Data-Parallel似乎更依赖串行训练。这种训练时间的减少还因为通信量降低而加倍明显。

天极网 on MSN4 天

AI普及加速度：昇腾大EP解决方案强势赋能

过去几年，业界普遍的观点认为，大模型的进步依赖于不断增加芯片资源的堆叠。而DeepSeek的横空出世以来，彻底改写了AI算力需求的游戏规则。

4 天

谷歌重磅推出全新Scaling Law，智能的未来将是分布式的？3万亿美元AI ...

谷歌推出的DiLoCo分布式训练方法，其Scaling Law比数据并行更稳健、更优越、更高效、更强大，其模型规模越大优势越明显，有效解决通信瓶颈，为大模型训练开辟新可能。网友称DiLoCo可能会重新定义Scaling的方式。

通信产业网8 天

H20芯片困局：在DeepSeek崛起下的挑战与反思

H20芯片背后潜藏的战略隐患同样不可小觑。英伟达借助H20芯片营造出一种“可用且实用”的假象，诱导国内企业对其产生依赖。倘若企业长期沉浸在这种依赖中，便可能如同温水煮青蛙一般，不知不觉间放缓自主研发的脚步，忽视对核心技术的攻坚突破，这对中国人工智能技术的自主发展而言，无疑是一种潜在的威胁。从企业自身发展的视角来看，依赖H20芯片或许能在短期内维持业务的基本运转，但从长远的战略眼光审视，这无疑是给自 ...

什么值得买社区频道 on MSN8 天

开源AI音乐生成模型：YuE，支持多语言、多风格、多专业级声乐！

音乐创作往往是灵感和技巧的结合，然而，创作一首完整的歌曲却需要大量的时间和专业知识。特别是如果你想要一首不只是简单的伴奏，而是拥有完整结构、丰富演唱 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果