选择Sora还是不选择Sora：OpenAI如何失去其竞争优势

OpenAI于12月7日宣布，其备受期待的视频生成模型Sora将向所有付费的ChatGPT用户开放。

这一公告是“OpenAI的12天”活动（也称为“shipmas”）的一部分，该活动从12月5日星期四开始，首先发布了o1模型，随后在第二天推出了强化微调研究项目。OpenAI的12天活动将持续到2024年12月20日星期五，距离圣诞节仅剩一周。

Sora尚未对英国和欧洲的用户开放，这让许多欧盟的生成式AI爱好者感到非常沮丧，他们认为该地区由于严格的法规正在失去宝贵的竞争优势。OpenAI并非唯一这样做的公司；Meta和最近的Google也发布了类似的文本到视频产品，并附有“尚未对我们的欧盟朋友开放”的条款。

可能的原因是这些公司担心在收集数据训练这些模型时可能违反了GDPR法规。然而，这越来越像是一场旨在通过激发技术爱好者和企业家的不满来影响欧盟监管机构的压力运动，因为他们无法在不使用VPN等绕过解决方案的情况下访问最新的文本到视频模型。这场运动可能会奏效，因为科技企业家通常人脉广泛，可以利用他们的影响力进行反击。此外，欧盟显然不想在AI革命中落后。

其他人则认为，无法访问一个或几个视频生成模型并不会特别受限，因为欧盟的AI爱好者和开发者可以通过Replicate或Hugging Face等平台访问替代模型，这些平台托管了开源解决方案。Meta（通过Meta Llama-3.2）和OpenAI（通过Sora）选择将欧盟排除在外以避免与潜在GDPR侵权相关的监管风险，实际上可能会加强当地的生成式AI视频生态系统。这迫使当地领导者依赖开源工具并促进创新解决方案的开发。

这也意味着遵守欧盟规则的本地参与者可能会面临更少的竞争，这最终可能对他们有利。一切尚未定局。

Sora的演示令人着迷。Sora允许用户根据文本提示创建视频。生成的视频最长可达20秒，这与其他难以在10到20秒内生成令人信服内容的文本到视频模型相当。

生成的视频质量似乎不错，与两年前相比，明显的缺陷更少（例如手指数量错误、不一致、双头、元素消失等）。

Sora还承诺通过指定或描述视频开始、5秒或中间部分的内容来控制视频的方向。最后，Sora允许进行编辑——例如替换元素（例如将大象换成汽车）或合并不同的视频。

所有这些功能都很有趣。 有趣，但并不具有革命性，因为开源模型也取得了显著进展，或多或少可以实现相同的结果。

然而，很明显，OpenAI提供了更好的用户体验（UX）。

其他视频生成模型面临的限制在使用Sora时也存在。视频仍然经常看起来像是慢动作（帧率问题？），长度限制在20秒，有时还会出现不一致的情况。例如，如果你要求Sora生成一只灰鹭捕鱼的视频，灰鹭可能会把头潜入水中，但最终却没有抓到鱼！显然，还有很长的路要走。

让我们退一步思考。为什么OpenAI要进行这场“shipmas”行动，在如此短的时间内推出12项新功能？

阅读更多：

Sora还是Not Sora？OpenAI如何失去了竞争优势

选择Sora还是不选择Sora：OpenAI如何失去其竞争优势

推荐阅读：

"Sora上线了！你准备好了吗？🔥"

FluxAI 中文