3月17日,国际权威大模型评测榜单LiveBench放榜,阿里巴巴最新开源的推理模型通义千问QwQ-32B冲入全球前五,超过OpenAI-GPT-4.5preview、Google-Gemini2.0等国内外顶尖模型,成为全球性能最强的开源模型之一。
千问QwQ-32B开源当天即登顶全球最大的AI社区HuggingFace模型榜榜首,是当下全球最受欢迎的开源大模型。在刷新开源推理模型性能纪录的同时,千问QwQ-32B还大幅降低部署使用成本,让全球先进的中国推理大模型首次在学术界、产业界广泛落地。目 ...
“残差神经网络发明人”、麻省理工学院副教授何恺明与图灵奖得主、“卷积网络之父”Yann LeCun的最新合作论文提出“无需归一化的Transformer”,目前已入选CVPR 2025,该发现有望进一步改进AI模型性能,给开发者们带来新思路。
来自Meta AI的华人科学家刘壮团队,联合AI大神何恺明, 图灵奖得住Yann LeCun等大牛搞了个大新闻——他们的最新论文证明了:Transformer ...
近日,图灵奖得主、Meta首席AI科学家杨立昆在一档播客节目中“炮轰”人形机器人。“很多人形机器人演示令人印象深刻,但实际很蠢,不少机器人公司都在豪赌未来3到5年AI会突飞猛进。” ...
机器之心报道机器之心编辑部何恺明又双叒叕发新作了,这次还是与图灵奖得主 Yann LeCun 合作。这项研究的主题是没有归一化层的 Transformer(Transformers without Normalization),并已被 CVPR ...
【新智元导读】 Transformer架构迎来历史性突破!刚刚, 何恺明 LeCun、清华姚班刘壮联手,用9行代码砍掉了Transformer「标配」归一化层,创造了性能不减反增的奇迹。
在最新突破性研究中,何恺明与Yann LeCun这对神级搭档惊艳世界,他们通过仅仅9行代码成功去除了Transformer模型中的归一化层,且模型性能非但没有下降,反而得到了提升。这一创新成果来自于纽约大学、Meta、麻省理工学院等多家顶尖学术机构的共同努力,研发出一种不依赖于传统归一化层的新型技术。
图灵奖获得者杰弗里?辛顿(Geoffrey Hinton)发帖称,马斯克应被英国皇家学会开除,理由是其对美国科研机构造成的巨大损害,并表示要看马斯克是否真的相信言论自由。对此,马斯克回应称只有懦弱、缺乏安全感的蠢货才在乎奖项和成员身份,历史才是真正的评判者,还指责其评论是无知、残忍且不实的。但马斯克同时询问自己具体哪些行为需要纠正,并表示自己虽会犯错但会努力改正。另一位获得者杨立昆(Yann Le ...