近日,Meta 公布了一款强大的 AI 视频生成系统,名为 Movie Gen。
据介绍,Movie Gen 是一个包含四个核心模型的 AI 系统:30B 参数的视频生成模型、13B 参数的音频生成模型、个性化视频生成模型,以及精确视频编辑模型。
这套系统最大的特点是:只需一张照片,就能创建逼真的个性化视频。它不仅可以生成最长 16 秒、1080P 的高清视频,还能为视频配上同步的音效和背景音乐,这是目前 AI 视频生成领域的一个突破。
此外,该系统的音频生成能力能够延伸至 45 秒,为创作者提供了更大的创作空间。
在技术层面,Movie Gen 采用了创新的“流匹配”(Flow Matching)技术,这种方法相比传统的扩散模型,具有更高的效率和稳定性。
作为综合性的创意工具,Movie Gen 的功能十分全面。
据 Meta 相关资料,它不仅能通过文字提示生成全新的视频内容,还能对现有视频进行精确编辑,包括更改特定元素、添加特效、更换背景等。这种编辑能力的精确性和灵活性,允许创作者在保持原有视频重点内容的同时,更精确地修改部分片段。
在音频方面,系统可以生成环境音效、配音和背景音乐,并确保与视频内容完美同步。
在性能评测方面,Meta 声称,Movie Gen 在人类评估测试中超越了类似的模型。例如,OpenAI 的 Sora、Runway 的 Gen-3 和快手的可灵等。
不过,与 Sora 类似,目前普通用户还不能使用 Movie Gen,官方只公布了演示视频。Meta 计划于 2025 年在Instagram 平台上推出 Movie Gen,这将使高级视频创作工具更加普及。
该公司强调,Movie Gen 的目标是“增强而非取代人类创作者”的工作。同时,其将进一步完善和优化 Movie Gen 的技术和性能,包括提高视频生成速度和整体质量。