Andrej Karpathy 的身份有很多个:李飞飞高徒、OpenAI 创始成员及研究科学家、特斯拉前 AI 高级总监、YouTube「学习区」知名博主。不过,从他对教育的热爱来看,以前在特斯拉、OpenAI 都是「副业」,现在做的 AI ...
币界网消息,去中心化 AI 协议 Prime Intellect 发文宣布已完成 1500 万美元融资,Founders Fund 领投,参投方包括 Menlo Ventures、Andrej ...
吴说获悉,去中心化 AI 协议 Prime Intellect 宣布已完成 1500 万美元融资,Founders Fund 领投,Menlo Ventures、Andrej Karpathy(EurekaAI、Tesla、OpenAI)、Clem Delangue(Hugging Face)等参投,该轮融资完成后使其募资总额超 2000 万美元。Prime Intellect ...
北京时间凌晨4点钟OpenAI举行一个14分钟左右的直播发布,GPT4.5 终于发布了!凌晨4点爬起来第一时间给大家更新,废话不多说,先看看Sam Altman的对GPT 4.5的感受:Sam:GPT-4.5 准备好了!好消息: ...
OpenAI 员工自己给 GPT-4.5 的评价是,不是一个推理模型,也不是基准测试的杀手,而是一个低调的研究预览版,对于复杂的数学、代码和严格遵循指令的任务,更推荐 o1 或者 o3-mini。
继近日斯坦福李飞飞、Percy Liang 等人推出 S1 后,李飞飞的学生、OpenAI 早期成员与前特斯拉 AI 总监也录制了一期最新长达 3 小时的长视频上传到 YouTube,深入浅出地从神经网络的起源、GPT-2、ChatGPT 到最近 ...
AI 大神Andrej Karpathy 刚刚发了一篇推文,他将训练大型语言模型 (LLM) 的过程巧妙地比作教育学生,并以教科书的结构为框架,阐述了当前 LLM 训练的 ...
近日,知名AI研究员Andrej Karpathy在社交媒体上分享了一篇极具启发性的推文,通俗易懂地解释了当前大型语言模型(LLM)训练的核心过程,包括预训练、监督式微调和强化学习。这一解释不仅为AI从业者提供了深刻见解,也为普通读者理解复杂的人工智能技术架起了桥梁。通过将模型训练比作教科书学习的结构,Karpathy为我们阐述了现代LLM的历史与未来。
近日,AI领域再度掀起波澜,一场关于大模型进化的深度探讨在YouTube上引发广泛关注。这场长达3小时的视频讲座,由李飞飞的学生、OpenAI早期成员及前特斯拉AI总监亲自录制,内容涵盖从神经网络的起源到GPT-2、ChatGPT,再到最新的DeepSeek-R1,深入浅出地揭示了AI大模型的系列演进。
Inception Labs 于周四发布了 Mercury Coder,这是一种新的 AI 语言模型,利用扩散技术比传统模型更快地生成文本。与逐字生成文本的传统模型(如 ChatGPT)不同,基于扩散的模型(如 Mercury)能够同时生成完整的响应 ...
据俄罗斯塔斯社2月25日报道,斯洛伐克国民议会副议长、斯洛伐克民族党主席安德烈·丹科(Andrej Danko)近日公开表示,乌克兰应归还斯洛伐克向其提供的35亿欧元援助资金。他指出,这笔款项对斯洛伐克来说至关重要,并质疑乌克兰如何偿还。
相信大家和我一样,对 GPT 的每一次迭代都充满了期待。这次的 GPT-4.5 更是吊足了大家的胃口,毕竟距离 GPT-4 发布已经过去大约两年了!AI 大神OpenAI联合创始人提前拿到了GPT4.5 的内测资格, Andrej Karpathy ...