资讯

来自复旦视觉与学习实验室和字节Seed的研究者们希望“验一验”自回归视觉生成模型的能力,他们保持“Next-token prediction”这样简洁优美的形式,而通过优化训练和推理过程来探究自回归视觉生成是否可以像扩散模型一样取得不错的文生图效果。
今年4月,字节跳动AI Lab和王立威团队联合开发出一种新的图像生成技术VAR,称“首次实现了自回归模型在图像生成任务中超越DiT”,而田某某以一作 ...