Andrej - 搜索 News

1 天

Andrej Karpathy 的身份有很多个：李飞飞高徒、OpenAI 创始成员及研究科学家、特斯拉前 AI 高级总监、YouTube「学习区」知名博主。不过，从他对教育的热爱来看，以前在特斯拉、OpenAI 都是「副业」，现在做的 AI ...

24 天

AI大神Andrej Karpathy通俗解析预训练、监督微调与强化学习的奥妙

近日，知名AI研究员Andrej Karpathy在社交媒体上分享了一篇极具启发性的推文，通俗易懂地解释了当前大型语言模型（LLM）训练的核心过程，包括预训练、监督式微调和强化学习。这一解释不仅为AI从业者提供了深刻见解，也为普通读者理解复杂的人工智能技术架起了桥梁。通过将模型训练比作教科书学习的结构，Karpathy为我们阐述了现代LLM的历史与未来。

新浪网28 天

Andrej Karpathy：我们需要让大模型“上学”，强化学习才刚开始

AI 大神Andrej Karpathy 刚刚发了一篇推文，他将训练大型语言模型 (LLM) 的过程巧妙地比作教育学生，并以教科书的结构为框架，阐述了当前 LLM 训练的 ...

来自MSN5 个月

深度｜ Andrej Karpathy 最新思考：小模型有巨大潜力，大模型用来处理 ...

在人工智能领域，Andrej Karpathy 的最新思考为我们提供了关于AI模型未来发展的深刻见解。他认为，虽然当前的大型模型非常强大，但未来的小型模型 ...

21 天on MSN

Andrej Karpathy力赞DeepSeek-R1：AI大模型正复刻人类思考逻辑

近日，AI领域再度掀起波澜，一场关于大模型进化的深度探讨在YouTube上引发广泛关注。这场长达3小时的视频讲座，由李飞飞的学生、OpenAI早期成员及前特斯拉AI总监亲自录制，内容涵盖从神经网络的起源到GPT-2、ChatGPT，再到最新的DeepSeek-R1，深入浅出地揭示了AI大模型的系列演进。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果