谷歌Veo 2震撼全场!OpenAI Sora惨遭碾压?
3 个月前
Google 的 Veo 2 震撼了所有人!(OpenAI Sora 被击败)
Google 在回应 Sora 和 Nova Reel 等视频生成模型的新发布时,做出了强有力的反击。随着 Veo 2 的加入,视频生成领域的竞争将在未来几个月内升温。早期的演示和基准测试表明,Veo 2 可能会为 AI 生成的视频内容的质量、真实性和提示遵循设定新的标准。让我们深入了解 Google Veo 2 及其功能。
什么是 Veo 2?
Veo 2 是 Google DeepMind 最新的 AI 视频生成模型,旨在根据详细的提示生成高质量、逼真且动态的视频。作为 OpenAI 的 Sora 和 Meta 的 MovieGen 等领先 AI 视频模型的强劲竞争对手,Veo 2 在遵循复杂指令、模拟现实世界物理效果以及捕捉各种电影效果方面表现出色。
主要特点
- 精准解读复杂提示:能够生成从延时摄影到广角航拍等各种电影效果。
- 结合文本和视觉线索:生成与用户意图高度一致的视频。
- 提供工具:用于指导镜头构图、相机角度和节奏,提供电影级别的细节。
- 保持视频连贯性:确保流畅的叙事和精美的最终成品。
基准测试表现与提示遵循
为了客观评估 AI 视频模型,Facebook Research 推出了 MovieGen Bench —— 一个让各种模型根据给定提示生成视频的环境。然后由人类评委根据整体偏好和与指令的契合度对这些输出进行评分。
在这些直接对比中,Veo 2 始终优于 OpenAI 的 Sora Turbo、CLling AI 和 Meta 的 MovieGen 等竞争对手。Veo 2 不仅在质量和观众偏好方面表现出色,还在提示遵循方面表现卓越。无论是要求生成繁忙城市景观中的漂移汽车场景,还是紧张的特写肖像,Veo 2 都能可靠地匹配用户的需求 —— 这使其与那些经常偏离原始提示的模型区别开来。
- 广泛评估:在 Meta 发布的 MovieGen Bench 数据集上测试了 1,003 个提示。
- 顶级表现:Veo 2 在整体偏好和提示准确性方面均获得了最高分。
- 一致的基准测试:所有模型均在 720p 分辨率下进行评估,以确保公平比较。
- 样本时长:Veo 2 的片段时长为 8 秒,VideoGen 的片段为 10 秒,其他模型的片段为 5 秒。
- 完整展示:所有视频都完整展示给评分者,进一步巩固了 Veo 2 作为领先 AI 视频生成模型的地位。
Veo 2 vs Sora
让我们并排比较 Veo 2 和 Sora 生成的视频:
提示 1
低角度镜头捕捉到一群粉红色的火烈鸟
在郁郁葱葱、宁静的泻湖中优雅地涉水。
它们羽毛的鲜艳粉红色
与周围植被的翠绿色
和清澈的蓝绿色水形成鲜明对比。
阳光在水面上闪烁,
形成闪烁的反射,
在火烈鸟的羽毛上舞动。
这些鸟优雅的弯曲脖子
在浅水中行走时被淹没,
它们的动作在泻湖中
激起轻柔的涟漪。
构图强调了场景的宁静
和自然之美,
突出了生态系统的微妙平衡
以及这些美丽鸟类的天生优雅。
清晨柔和、漫射的光线
为整个场景
披上了一层温暖、空灵的光芒。
Veo 2 输出:
观察
Veo 2 最引人注目的是其惊人的真实感。从特写镜头到细节的遵循,Veo 2 的表现比 Sora 更出色!
如何访问 Veo 2?
- 注册等待名单:Veo 2 尚未对所有人公开。首先加入等待名单,这将使你在获得访问权限时排在前面。(点击这里注册)
- 关注邮件更新:留意你的收件箱。当你的访问权限被批准时,你将收到一封包含说明的通知邮件。
- 开始使用:一旦获得访问权限,使用 Veo 2 非常简单。只需输入你的提示,即可开始生成你自己的 AI 驱动视频内容。
推荐阅读:
FluxAI 中文
© 2025. All Rights Reserved