“残差神经网络发明人”、麻省理工学院副教授何恺明与图灵奖得主、“卷积网络之父”Yann LeCun的最新合作论文提出“无需归一化的Transformer”,目前已入选CVPR 2025,该发现有望进一步改进AI模型性能,给开发者们带来新思路。
来自Meta AI的华人科学家刘壮团队,联合AI大神何恺明, 图灵奖得住Yann LeCun等大牛搞了个大新闻——他们的最新论文证明了:Transformer ...
机器之心报道机器之心编辑部何恺明又双叒叕发新作了,这次还是与图灵奖得主 Yann LeCun 合作。这项研究的主题是没有归一化层的 Transformer(Transformers without Normalization),并已被 CVPR ...
千问QwQ-32B开源当天即登顶全球最大的AI社区HuggingFace模型榜榜首,是当下全球最受欢迎的开源大模型。在刷新开源推理模型性能纪录的同时,千问QwQ-32B还大幅降低部署使用成本,让全球先进的中国推理大模型首次在学术界、产业界广泛落地。目 ...
Yann LeCun:例如,物体会下落,是因为重力把它拉向地球。婴儿大约在九个月大的时候就能理解这一点。也许,当前AI发展的限制在于我们对现实的认知。我们无法创造出超越自身理解能力的东西。我们不清楚重力是如何产生的,也不知道量子世界如何转变为经典世界 ...
何恺明又双叒叕发新作了,这次还是与图灵奖得主 Yann LeCun 合作。 这项研究的主题是没有归一化层的 Transformer(Transformers without Normalization),并已 ...
傅盛:阿里可能想做一个可以执行所有应用的通用Agent。什么是AI时代的超级应用?可能就是一个能解决80%问题的智能体,搜索、写诗、写报告、扫描、生成PDF文档等。如果这个通用Agent面对各项任务时都能把满意度做到都足够高,就会有很强的黏性。
在过去这一年间,RL从一度沉沦的位置,重新走回了AI研究的闪光灯中心。2024年下半年,OpenAI率先发布了它在LLM基础上,用RL实现“深度思考”的成果——o1,设定了新的终点线。今年初,DeepSeek将赛道上的迷雾更进一步迅速驱散了,把自己的 ...
编辑:编辑部 ZYJ 【新智元导读】Transformer架构迎来历史性突破!刚刚,何恺明LeCun、清华姚班刘壮联手,用9行代码砍掉了Transformer「标配」归一化层,创造了性能不减反增的奇迹。
过去几周,美国科学界遭受了「灭顶之灾」,哥大、哈佛、宾大约翰·霍普金斯大学等众多名校纷纷被砍去经费,冻结招聘,不得不撤销已发出的offer。有人说,特朗普新政对美国科研造成的破坏程度之深,可能需要几代人的时间,才能被充分认识。
近日,图灵奖得主、Meta首席AI科学家杨立昆在一档播客节目中“炮轰”人形机器人。“很多人形机器人演示令人印象深刻,但实际很蠢,不少机器人公司都在豪赌未来3到5年AI会突飞猛进。” ...