42GB - 搜索 News

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

新浪网4 天

MLSys’25 | 极低内存消耗：用SGD的内存成本实现AdamW的优化性能

例如，预训练 LLaMA 7B 的一个批次就消耗高达 58GB 内存：14GB 用于模型参数，42GB 用于优化器状态和梯度。这巨大的 “隐形” 内存开销迫使研究者不得 ...

搜狐4 天

高增长品牌大疆DJI：创新技术引领未来，无人机与智能相机市场领导者

性能方面，支持45分钟续航、20公里图传、42GB机身存储，并支持关机快传，极大提升了用户的使用体验。智能相机大疆DJIOsmoPocket3一英寸口袋云台相机DJIOsmoPocket3是一款便携式云台相机，专为Vlog创作者和日常记录者设计。其1英寸影像传感器提供卓越的图像质量 ...

51CTO7 天

重磅！Unsloth开源新算法：让GRPO训练大模型所需显存降低90%，告别 ...

这个量级的显存需求，即便是顶配的训练服务器也难以满足。而Unsloth团队通过其创新的算法优化，将这一需求降低到了惊人的54.3GB，这意味着：训练内存成本：从414GB降至42GB GRPO内存成本：从78.3GB降至9.8GB Unsloth团队采用了三个关键的技术创新来实现这一突破 ...

搜狐23 天

彻底告别服务器繁忙！个人电脑上私有安装DeepSeek的完整指南

拉取DeepSeek模型：打开终端，输入命令：ollama run deepseek-r1:70B，根据电脑配置选择适合的模型版本。注意，70B模型需要42GB，下载时间预计在40分钟左右，这取决于网络速度。启动DeepSeek：在终端运行DeepSeek的命令后，用户可以通过简单的文本交互界面，与智能助手 ...

搜狐24 天

PC将成AI端侧模型落地首站，DeepSeekR1带来高效个性化体验

近年来，人工智能技术飞速发展，尤其是在生成式人工智能领域的重大突破引发了全球的关注。开源证券最新发布的研究报告 ...

新浪网24 天

电子行业点评报告：AI+端侧之AIPC：大模型+生产力，本地化部署第一站

核心观点：PC凭借高性能硬件和生产力属性有望成为端侧模型落地首站近期DeepSeek R1模型受到广泛关注，其通过架构与算法创新显著降低开发成本 ...

来自MSN19 天

DeepSeek-70B本地化部署指南！断网也能轻松装，超实用！

【本文由小黑盒作者@Timeow于02月12日发布，转载请标明出处！】 2025大年初一的时候我曾发了一篇如何在本地部署DeepSeek大模型的流程教程，意外的 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果