Goku AI基于新兴的校正流Transformer架构(RectifiedFlowTransformer),于2025年2月正式发布技术报告。其突破性的设计优化了图像与视频的联合生成,使得Goku能够在短时间内生成高质量的视频内容。同时,智源研究院发布的评测结果显示,Goku在视频生成功能上的表现尤为突出,逐渐将自身从一种单纯的工具,转型为一个强大的创作伙伴。
近日,字节跳动正式推出其最新的AI视频生成模型OmniHuman-1,这是全球范围内最引人注目的文本生成视频技术之一。这款模型以其超高的画质和精准的音视频同步技术,标志着AI生成视频技术已进入了一个全新的爆发期,掀起了科技界和创意产业的热议。那么,OmniHuman-1究竟有何独特之处,又将如何重新定义视频制作的未来呢?
造出它的新模型名为 Goku (悟空) ,是一系列基于 rectified flow Transformer 的模型,专为图像和视频联合生成而设计,支持文生视频、图生视频、文生图。
20 天
品玩 on MSN字节联合港大发布新视频模型GokuGoku 模型的特点在于其高效地生成速度和图像质量。通过使用大量的数据训练,Goku 可以生成包括动画、自然风光、动物行为等多种场景。研究人员使用了原版的 MovieGenBench 提示进行测试,确保了演示效果的一致性和公平性。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果