在计算机科学领域,它的核心是模块化概念,比如深度神经网络由作为模块化单元的原子「层」构建而成。同样地,现代生成模型(如扩散模型和自回归模型)由原子「生成步骤」构建而成,每个步骤都由深度神经网络实现。
科技界迎来又一重大突破!何恺明团队近日提出了一种全新的生成模型——分形生成模型(Fractal Generative Models),首次实现了高分辨率图像的逐像素生成,计算效率较传统方法提高了惊人的4000倍。这一创新成果不仅在计算机视觉领域具有划时代意义,也为AI绘画等多领域应用开辟了新可能。
想法很有意思,核心思想是递归地调用生成模型作为模块,构建具有自相似性的生成模型。 就是将一个图形不断地进行放大,会发现放大后的图形与原始图形在结构上非常相似。简单地类比,就像雪花一样,是一种典型的分形(Fractal)结构。 作者想法的核心来源是: ...
近日,MIT计算机科学家何恺明团队在生成模型领域取得重大突破,提出了全新的分形生成模型(Fractal Generative Models),首次实现了逐像素生成高分辨率图像,计算效率较传统方法提升了4000倍。这一创新成果标志着生成模型领域进入了一个全新阶段。
白交 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 何恺明再次开宗立派!开辟了生成模型的全新范式—— 分形生成模型Fractal Generative Models,首次使逐像素生成高分辨率图像成为可能,论文名字依旧延续以往的大道至简风格。