资讯

据悉,SkyReels-V2在技术上实现了显著突破,能够生成流畅且逼真的视频内容,满足电影制作中对高质量运动动态的需求。该模型已支持生成30秒、40秒的视频,并具备生成高运动质量、高一致性和高保真视频的能力。
据介绍,当前业界视频生成技术尽管已取得长足进展,但仍面临多项挑战:在保证高质量视觉呈现的同时往往牺牲运动流畅度,为实现高分辨率而限制视频时长,且由于现有多模态大模型对电影语法理解不足,导致缺乏专业镜头感知生成能力。针对这些痛点,SkyReels-V2展现出独特优势, 目前已支持生成30-40秒的高运动质量、高一致性、高保真视频 。
据介绍,现有技术在提升稳定的视觉质量时往往牺牲运动动态效果,为了优先考虑高分辨率而限制视频时长(通常为 5-10 秒),并且由于通用多模态大语言模型(MLLM)无法解读电影语法(如镜头构图、演员表情和摄像机运动),导致镜头感知生成能力不足。这些相互关联的限制阻碍了长视频的逼真合成和专业电影风格的生成。
现有技术在提升稳定的视觉质量时往往牺牲运动动态效果,为了优先考虑高分辨率而限制视频时长(通常为5-10秒),并且由于通用多模态大语言模型(MLLM)无法解读电影语法(如镜头构图、演员表情和摄像机运动),导致镜头感知生成能力不足。这些相互关联的限制阻碍了长视频的逼真合成和专业电影风格的生成。
人民财讯4月21日电,4月21日,昆仑万维SkyReels团队正式发布并开源SkyReels-V2——全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型,其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架 ...