你不会相信使用 Runway 创建 AI 视频的结果:1,000 字符提示的详细解析


7 个月前

Runway 是最受欢迎的 AI 视频生成器之一,最近的更新使得你可以输入最多 1,000 个字符的提示。

每个 AI 模型在提示的方式上略有不同,有些更喜欢长而复杂的提示,而另一些则希望更具体和集中。Runway 似乎介于两者之间,其提示指南要求具体性和一定的简洁性。

为了找出 1,000 个字符是否必要以从文本提示中获得令人印象深刻的现实感和运动感,我想出了几个概念,并为每个概念创建了短和长的提示,遵循 Runway 的提示指南。

创建提示

我需要为每个概念开始一个一般性的想法,并且这个想法需要能够支持更具描述性的提示——因此它需要具有特定的特征或运动要求。

我更喜欢使用图像转视频,因为它能让你对输出有更多控制,但在使用文本转视频时,Runway 的图像质量也很出色。因此,在这个测试中,我决定仅使用文本。图像转视频也可以使用最多 1,000 个字符。

1. 交通工具的演变

None

短提示 (图片来源: Runway Gen-3 Alpha/Future AI)

None

长提示 (图片来源: Runway Gen-3 Alpha/Future AI)

一句话提示:

“超高速 FPV 画面:相机无缝穿越不同的时代,展示从古代到未来的交通工具演变。”

长提示:

“连续超高速 FPV 画面:相机无缝穿越不同的时代,展示交通工具的演变。从古埃及的木制雪橇和战车开始,滑过大金字塔。过渡到中世纪欧洲,展示马车在鹅卵石街道上行驶。快速穿越工业革命,突出蒸汽机车和早期汽车。进入 20 世纪,展示莱特兄弟的首次飞行,过渡到商业航空公司在城市上空翱翔。深入现代,展示流线型电动车和磁悬浮列车。相机运动加速,模糊场景以代表创新的快速步伐。在未来的城市景观中出现,飞行汽车、超级高铁系统和传送舱。”

2. 花朵绽放的延时摄影

None

短提示 (图片来源: Runway Gen-3 Alpha/Future AI)

None

长提示 (图片来源: Runway Gen-3 Alpha/Future AI)

一句话提示:

“静态延时摄影:一朵生机勃勃的花朵在阳光明媚的花园中绽放,从花蕾到盛开。”

长提示:

“静态延时摄影:一朵花蕾在阳光明媚的花园中占据中心位置,位于画面的下三分之一。背景略微模糊,显示出其他植物和花朵的柔和、暗淡色彩。随着视频的进行,花蕾缓慢展开,露出层层鲜艳的花瓣。光线逐渐从清晨的冷蓝色调转变为正午阳光的温暖金色。花瓣上的露珠在光线下闪烁,随着蒸发而消失。小昆虫偶尔飞过画面,为场景增添生机。随着花朵完全绽放,颜色愈加鲜艳,成为构图的焦点。画面中可能会有来自屏幕外的阴影短暂掠过,暗示时间的流逝。”

3. 城市景观的倒影

None

短提示 (图片来源: Runway Gen-3 Alpha/Future AI)

None

长提示 (图片来源: Runway Gen-3 Alpha/Future AI)

一句话提示:

“静态镜头:一个水洼反射出繁忙的城市景观,行人和车辆经过,形成镜像世界的效果。”

长提示:

“静态镜头:画面水平分为上下两部分,下半部分是城市人行道上的水洼。水洼如同镜子,完美反射出上方繁忙的城市景观。真实的城市景观占据画面的上半部分,展示现代建筑、交通信号灯和繁忙的街道。随着视频的进行,人们的腿和车辆的底部穿过画面,它们的倒影在水洼中形成涟漪。光线暗示着下午晚些时候,长长的阴影和温暖的金色阳光在窗户和水面上闪烁。水洼中的倒影似乎比真实的世界更为生动,颜色因水而略显增强。偶尔有树叶或杂物漂浮在水洼上,短暂打破倒影。静态相机与城市生活的持续运动形成了催眠的效果。”

4. 沙堡与潮汐

None

短提示 (图片来源: Runway Gen-3 Alpha/Future AI)

None

长提示 (图片来源: Runway Gen-3 Alpha/Future AI)

一句话提示:

“低角度静态镜头:一个精心建造的沙堡逐渐被涌来的潮水吞没。”

长提示:

“低角度静态镜头:一个精美的沙堡位于画面中央,温暖的下午阳光突显出其精致的细节。沙堡占据了画面约三分之一的空间,背景可见海洋。视频开始时,沙堡周围的沙子是干燥的,潮水在远处。渐渐地,小波浪开始靠近,白色的泡沫与金色的沙滩形成对比。涌来的水在沙堡上形成倒影,为场景增添深度。随着潮水的推进,沙堡的基础开始被侵蚀。小塔和桥开始崩溃,沙子与涌来的水混合。光线微妙地变化,暗示着日落的临近,颜色变得更加温暖和浓烈。”

5. 云的变形

None

短提示 (图片来源: Runway/Midjourney/Future AI)

None

长提示 (图片来源: Runway/Midjourney/Future AI)

一句话提示:

“静态广角天空镜头:一朵云在绚丽的日落天空中变换成各种形状,从动物到物体。”

长提示:

“静态广角天空镜头:画面充满了戏剧性的日落天空,涂抹着鲜艳的橙色、粉色和紫色。一朵显眼的云位于画面中央,背景色彩斑斓。随着视频的进行,云缓慢变换成不同的可识别形状。它可能开始时是一个简单的积云,然后逐渐变成一只兔子,耳朵和蓬松的尾巴清晰可见。形状继续变化,可能变成一只帆船,具有明显的船体和鼓起的帆。这些变形继续,可能包括一棵树、一条鱼或一座城堡。在这些变形过程中,周围的天空颜色微妙变化,模仿日落时光线的变化。远处的小云保持静止,强调了中央云的神奇特质。光线起着关键作用,太阳的位置(屏幕外)使云的边缘发光,并在其形状内创造出有趣的阴影。”

最后想法

比我预期的更长的提示在这些主要基于场景的提示中产生了更大的差异。如果你尝试类似长度的提示,涉及到人或动物,可能会导致更大的失真和错误,因为建模运动物理更为困难。

我并不认为你需要完整的 1,000 个字符来获得良好的结果。在大多数情况下,单句视频并不差,只是缺少了一些我想要的具体细节。但在某些领域使用更多可用空间以获得更具体的内容是值得的。

你也可以通过从图像开始而不是视频来避免使用长提示,然后它将根据该设计构建视频,留下文本提示仅用于视频中的运动。

推荐阅读:

FluxAI 中文

© 2025. All Rights Reserved