Ahamoment - 搜索 News

200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

搜狐10 天

200多行代码，超低成本复现DeepSeek R1「Aha Moment」！复旦大学开源

在关于 DeepSeek 的文章中，我们会多次听到「Aha Moment」这个词。它指的是模型在训练过程中经历的一种顿悟时刻，表现为模型突然展现出类似人类的自我反思和策略调整能力。 DeepSeek 论文中提到的 Aha Moment。 DeepSeek-R1-zero 经过强化学习实现了大模型顿悟时刻的 ...

腾讯网1 天

如何打造一款月入110万美元的AI卡路里追踪应用

Zach，17岁，创建Cal AI，一款AI卡路里追踪应用，月入110万美元。他通过高端定位、多选项定价、免费试用及心理策略优化转化。测试驱动定价，平衡用户量与收入，展现了一个高中生如何用价值与数据打造成功的商业模式。

新浪网10 天

200多行代码，超低成本复现DeepSeek R1「Aha Moment」！复旦大学开源

在关于 DeepSeek 的文章中，我们会多次听到「Aha Moment」这个词。它指的是模型在训练过程中经历的一种顿悟时刻，表现为模型突然展现出类似人类的 ...

搜狐28 天

重现Deepseek R1 「Aha Moment」的完整教程来了！

DeepSeek r1 模型惊艳亮相后，其创新及模型实力获得了众多称赞和好评，但同时也因一些数据问题被质疑其涉嫌抄袭OpenAI 模型。平台声明：该文观点仅代表作者本人，搜狐号系信息发布平台，搜狐仅提供信息存储空间服务。

腾讯网1 天

DeepSeek-R1后又一推理训练里程碑：用递归重构Transformer

《AI未来指北》课代表系列——AI大事儿的最快、最全解读，本文关注大模型推理技术技术上最新的突破——通过改造Transformer模型，用递归的方法让AI自发涌现出推理能力。这一研究可能会对模型推理训练后续的范式产生深刻影响。腾讯科技《AI未来指北》 ...

2 天

九章云极 Aladdin重塑 AI 开发范式的先锋力量

在大会论坛上，九章云极DataCanvas公司AI首席科学家缪旭博士受邀发表主旨演讲。他表示，“ 算力不应是少数企业的‘奢侈品 ’，而应成为开发者触手可及的‘日用品’ ...

来自MSN2 天

2025年DeepSeek背景、模型技术及其对AI行业的影响分析报告

01摘要当全球科技巨头还在为AI模型的高昂成本发愁时，一家成立仅两年的中国初创企业DeepSeek，以"性能比肩OpenAI、价格仅为二十七分之一、全栈开源"的颠覆性突破，正在掀起人工智能领域的"中国风暴"。最新数据显示，其旗舰产品DeepSeek- ...

6 天

1/30训练步骤复刻DeepSeek-R1-Zero，沈向洋姜大昕张祥雨等新研究

在训练步骤约680步时，模型的训练奖励值、反思能力和回答长度同时出现显著提升，疑似出现了DeepSeek-R1-Zero论文中类似的“顿悟时刻” （aha moment）。通过广泛的实验，团队证明了一种极简主义 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果