近期,MIT 团队火遍外网的新论文《History-guided Video Diffusion》提出了一种全新算法 Diffusion Forcing Transformer(DFoT),在不改动原有架构的情况下就能让模型稳定输出比之前近 50 倍、近千帧长的视频。