Bias - 搜索 News

1 天

何恺明与LeCun携手创新：9行代码颠覆Transformer归一化层，性能提升神速！

在AI领域，归一化层长久以来被视为现代神经网络的基石之一，然而，最新研究却颠覆了这一传统观念。知名科学家何恺明和Yann LeCun合作带来了令人振奋的突破——通过引入名为DyT（动态Tanh）的新型模块，仅用9行PyTorch代码便能完全取代LayerNorm或RMSNorm，且不仅保留了相同的性能，还在训练和推理效率上实现了大幅提升。这项研究成果已经成功入选2025年CVPR会议。

Am J Epidemiol：科学家证实乳腺密度与高风险乳腺癌之间的神秘关联

这项研究中，研究者Jane ...

何恺明LeCun改造Transformer！9行代码替代归一化性能不减还加速

DyT适用于注意力块、FFN块和最终归一化层，尽管它可能看起来像是激活函数，但在这篇研究中不会改变原始架构中激活函数的任何部分，网络的其他部分也保持不变。

1 天

技术革新：9行代码颠覆Transformer归一化层的性能极限

近年来，深度学习技术的突破不断推动着技术应用的边界扩展，尤其是在Transformer架构的创新上，成为当下研究的热点之一。随着数据量的不断增大，模型的训练和推理效率显得尤为重要。在这一背景下，逐渐显现出“全新”“技术革新”“深度解析”等关键词的价值，吸引了众多企业和开发者的目光。

阿斯达克财经网5 天

传信达生物(01801.HK)计划向全球药厂授权PD-1/IL-2产品IBI363

据《彭博通讯社》引述知情人士指，信达生物(01801.HK)在与一家顾问机构合作，评估全球制药公司对其自研首创PD-1/IL-2 ...

威慑研究：一个仍在发展中的领域

威慑研究：一个仍在发展中的领域作者：杰弗里·H·迈克尔斯，伦敦国王学院科学与安全研究中心。来源:Michaels, J. H. Deterrence Studies: A field still in progress. Journal of ...

人人都是产品经理 on MSN1 天

AI大模型技术解析-大模型背后的秘密

随着AI技术的飞速发展，大模型如ChatGPT等已成为人工智能领域的热门话题。然而，这些看似“灵性”的创造行为背后，实则隐藏着精密的机械逻辑和技术架构。本文将深入解析AI大模型背后的秘密，从Chat的含义、LLM（大型语言模型）的定义、Token的计 ...

3 天

奚恺元教授对话诺奖得主塞勒：真正的决策高手，是如何洞察人心的？

奚恺元：行为科学不仅为我们提供了理解人类行为的新视角，而且可以帮助我们设计更好的选择架构，让人们在日常生活和工作中更容易做出更好的决策，进而提升整体幸福感。正如理查德·塞勒教授所强调的，一个关键的指导原则是避免陷入“现状偏差”，即不要仅仅因为“这是我们一直以来的做法”而固守旧习。

什么值得买社区频道 on MSN3 天

小红书基于 PPO 的多模态大模型 RLHF 系统的设计与优化

随着大模型技术从技术变革转向产业变革，大模型应用也会进一步繁荣，传统基础设施技术已经不足以满足大模型应用的快速发展。整个基础设施技术和产业链正在快速转型，向大模型基础设施技术演变。2025 QCon 全球软件开发大会（北京站）策划了「面向 AI ...

财富中文网4 天

ChatGPT也会产生“焦虑”情绪

• ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果