打破框架:非常规纵横比如何彻底改变我的AI肖像摄影?


3 个月前

EJ Yao 生成的 Midjourney V6.1 图像

打破框架:非传统的纵横比如何革新我的 AI 人像摄影

一位摄影师的意外发现:为什么更宽的画幅可能是解决 AI 手部渲染挑战、创造更自然人像构图的关键。

你有没有过这种感觉:在创造上陷入困境,仅仅因为“这是一直以来的做法”而遵循相同的模式?最近我经历了一次颇具启发性的体验,挑战了我对人像摄影的先入之见,特别是在处理 AI 生成的图像时。我想和你分享这个过程,因为我相信这可能帮助你打破自己的创作限制。

创意视野

我开始创作一系列捕捉粗犷户外生活本质的人像。想象一下:一个肌肉发达的身影在森林中劈柴,斧头划出的弧线在半空中定格。另一个场景是同一个角色在木头上细心雕刻复杂的图案,汗水在斑驳的阳光下闪烁。这一系列场景还包括围着篝火做饭,甚至有一个人在雄伟的树下弹吉他的宁静时刻。

这些不是随意的场景——它们是精心设计的提示,旨在讲述人类力量与自然之美之间的联系。每个提示都经过细致撰写,旨在捕捉的不仅是动作,还有氛围:光线的运用、肌肉的紧绷、脸上的专注。

令人沮丧的挑战

一切看起来都很有希望,直到我遇到了一个重大的障碍:手。哦,那双麻烦的手!如果你曾经与 AI 图像生成打过交道,你可能深知我在说什么。手指看起来不自然,有时更像是抽象艺术而非人类解剖。这个问题令人沮丧到让我想要放弃,等待下一个版本的 Midjourney,Midjourney v7,希望它能最终解决这个持续存在的问题。

早期尝试传统人像格式显示了在静态姿势中手的位置有多么不自然。

手的问题尤其突出,因为它们对每个场景至关重要。起初,我试了看起来合乎逻辑的方法——静态人像拍摄,姿势放松。毕竟,一个简单、静止的姿势不是更容易让 AI 处理吗?令人惊讶的是,这些“更简单”的镜头实际上突显了手部的缺陷。某种程度上,轻松、放松的手部位置使得每一个小缺陷都显得格外明显。

意外的解决方案

故事在这里发生了有趣的转折。在尝试不同选项时,我发现了两个改变游戏规则的见解:

EJ Yao 生成的 Midjourney V6.1 图像,使用的提示如下:

一个英俊、肌肉发达的人在森林中画一个生动的风景画。这个人手持画笔,动作刻意,阳光下汗水在他们的额头上闪烁。他们穿着无袖背心和粗犷的裤子,身上有颜料的飞溅,为他们的服装增添了创意的点缀,电影感 --ar 16:9 --sref https://s.mj.run/dmbIa2Pgy-E --sw 30 --stylize 220 --v 6.1

EJ Yao 生成的 Midjourney V6.1 图像,使用的提示如下:

一个英俊、肌肉发达的人在森林空地上的篝火上做饭。这个人正搅拌一锅蒸汽腾腾的汤,汗水从火焰的热量中顺着他们的脸流下来。他们穿着无袖背心,展示出健美的手臂和粗犷的裤子。电影感 --ar 16:9 --sref https://s.mj.run/dmbIa2Pgy-E --sw 30 --stylize 220 --v 6.1

首先,我发现以动作为驱动的构图比静态姿势产生明显更好的效果。当手部参与特定活动——劈柴、弹吉他、绘画时,它们看起来更自然,更真实。好像给 AI 提供了一个明确的“目的”,帮助它理解怎样更真实地摆放手。工具和物体提供的上下文为手的位置提供了指导,而隐含的运动则帮助掩盖了任何小的缺陷。

不同纵横比的直接比较显示,较宽的格式提供了更好的上下文,使手部位置更加自然,并且更加

一个英俊、肌肉发达的人在森林中的大树下弹奏原声吉他。这个人坐在一根原木上,热情地拨动琴弦,额头上在金色的光线下闪烁着汗水。他们穿着无袖背心,突显出强健的手臂,配上一条合身的粗犷裤子,电影感 --ar 16:9 --sref https://s.mj.run/dmbIa2Pgy-E --sw 30 --stylize 220 --v 6.1

第二,真正在这里取得突破的是:当我开始尝试纵横比,特别是像 3:2 和 16:9 这样的更宽格式时,发生了意想不到的事情。这些效果不仅是轻微的改善——它们大大提高了效果。较宽的格式似乎给 AI 提供了更多的上下文,使其能够生成更自然的手部表现和更好的整体构图。就像给 AI 一幅更大的画布,使其能够更好地理解图像中的元素之间的空间关系。

EJ Yao 生成的 Midjourney V6.1 图像,使用的提示如下:

一个英俊、肌肉发达的人在森林中一块木头上雕刻精美的图案。这个人专注着,汗水在斑驳的阳光下闪烁在他们的额头上。他们穿着无袖背心,突显出肌肉线条,搭配一条合身的粗犷裤子。电影感 --ar 16:9 --sref https://s.mj.run/dmbIa2Pgy-E --sw 30 --stylize 220 --v 6.1

EJ Yao 生成的 Midjourney V6.1 图像,使用的提示如下:

一个英俊、肌肉发达的人在一个宁静的森林环境中用天然纤维编织篮子。这个人专注于他们的工作,手灵巧地移动,汗水在温暖的阳光下闪烁在他们的手臂上。他们穿着无袖背心和合身的耐用裤子,将粗犷与艺术相融合。电影感 --ar 16:9 --sref https://s.mj.run/dmbIa2Pgy-E --sw 30 --stylize 220 --v 6.1

使这一发现特别引人入胜的是这两个见解是如何相互作用的。更宽的纵横比为以动作为驱动的构图提供了更多空间,使手与物体和环境以更自然的方式互动。额外的横向空间不仅使图像看起来更具电影感——而且还为 AI 提供了创造更自然的主角与环境之间互相作用的空间。

更大的画面

这次经历教会我一些重要的东西,超越了单纯的技术设置。它让我意识到陷入传统思维是多么容易。我一直在限制自己,认为人像照片需要以人像格式拍摄,仅仅是因为这个名字的暗示。更根本的是,我假设简单的姿势对于 AI 更容易处理,而实际上,结果却是相反的。

有时候,最佳的解决方案来自对基本假设的质疑。如果何为“正确的方法”实际上并不是适合你特定情况的最佳方法呢?如果传统智慧只是一个起点,而不是刻在石头上的规则呢?

在 Midjourney 中入门纵横比

如果你对 Midjourney AI 的纵横比参数陌生,这里有一个快速入门指南:在撰写提示时,通过添加 --ar 后跟两个数字,你可以轻松控制图像的尺寸。例如, --ar 16:9 将为你提供宽阔的电影效果(非常适合风景或动作场景),而 --ar 9:16 则创建适合手机屏幕的高格式图片(非常适合人像)。如果你没有指定任何纵横比,Midjourney 将默认采用正方形格式(1:1)。一个方便的小贴士:对于微调,可以尝试 3:2 或 4:3 这样的比例——它们没有 16:9 那么极端,但仍然在需要时为你提供额外的空间。请记住,第一个数字控制宽度,第二个控制高度,你需要使用整数(例如 --ar 139:100 而不是 1.39:1)。

2025年1月 Midjourney AI 网站屏幕截图

如果你正在使用 Midjourney 网站,你会注意到界面中有一个方便的图像大小选择器,具有人像、正方形和风景选项。虽然这是一种用户友好的设置纵横比的方法,但这里有一个重要提示:如果你在提示文本中包含 --ar 参数,它将覆盖在 UI 中进行的任何选择。因此,如果你在使用网页界面的控件,请确保从提示文本中删除任何 --ar 参数,以避免混淆。从这些基础开始,很快你就能掌握纵横比的技巧!

向前迈进

对于现在正在阅读这篇博客并与 AI 图像生成一起工作的任何人,我鼓励你大胆尝试不同的纵横比,即使它们看起来违背直觉。AI 生成的美妙之处在于,这种实验成本只需几分钟你的时间——与传统艺术相比,每次迭代都需要新的材料、设置和数小时的工作。你可以在设置一次传统拍摄的时间内测试数十种纵横比!

但更重要的是,我希望这个故事能激励你质疑自己的创意假设,无论你身处哪个领域。你正在遵循的“规则”是否仅仅是因为它们是传统的?如果你挑战这些假设会发生什么?实验的门槛从未如此之低,尤其在数字领域——为什么不利用这个机会?

有时候,最佳的解决方案来自最意想不到的地方。而有时候,看似技术上的限制可能会导致创造性的突破——如果我们愿意跳出框框,或者在这个案例中,跳出传统的框架。

你有没有经历过类似的体验,让打破常规带来了更好的结果?你是否发现其他低成本的方式来实验你的创作过程?我希望在下面的评论中听到你的故事。

FluxAI 中文

© 2025. All Rights Reserved