Andrej Karpathy 的身份有很多个:李飞飞高徒、OpenAI 创始成员及研究科学家、特斯拉前 AI 高级总监、YouTube「学习区」知名博主。不过,从他对教育的热爱来看,以前在特斯拉、OpenAI 都是「副业」,现在做的 AI ...
近日,知名AI研究员Andrej Karpathy在社交媒体上分享了一篇极具启发性的推文,通俗易懂地解释了当前大型语言模型(LLM)训练的核心过程,包括预训练、监督式微调和强化学习。这一解释不仅为AI从业者提供了深刻见解,也为普通读者理解复杂的人工智能技术架起了桥梁。通过将模型训练比作教科书学习的结构,Karpathy为我们阐述了现代LLM的历史与未来。
AI 大神Andrej Karpathy 刚刚发了一篇推文,他将训练大型语言模型 (LLM) 的过程巧妙地比作教育学生,并以教科书的结构为框架,阐述了当前 LLM 训练的 ...
在人工智能领域,Andrej Karpathy 的最新思考为我们提供了关于AI模型未来发展的深刻见解。他认为,虽然当前的大型模型非常强大,但未来的小型模型 ...
近日,AI领域再度掀起波澜,一场关于大模型进化的深度探讨在YouTube上引发广泛关注。这场长达3小时的视频讲座,由李飞飞的学生、OpenAI早期成员及前特斯拉AI总监亲自录制,内容涵盖从神经网络的起源到GPT-2、ChatGPT,再到最新的DeepSeek-R1,深入浅出地揭示了AI大模型的系列演进。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果