Flux | 如何通过提示和 LoRA 控制图像布局和背景清晰度


7 个月前

大家好!今天我很高兴与大家分享一些我在实验 Flux 模型时学到的关键技巧。在过去的几天里,我生成了大约 500 张图像,调整了提示和 LoRA,以观察不同的提示结构如何控制图像布局和背景清晰度。在这篇文章中,我将带你了解这些技巧,并展示如何在自己的图像生成项目中使用它们。

让我们开始吧!

同时欢迎你查看与本文相辅相成的精彩视频教程:

1. 通过提示结构控制布局

控制图像布局的最有效方法之一是调整你在提示中描述场景的方式。具体来说,你提供的细节程度和描述的顺序会显著影响图像中主体的大小背景的清晰度

示例 1:主体优先

考虑以下提示:

一个渔夫,戴着磨损的帽子和厚厚的毛衣,渔网搭在肩上,脸庞被海风侵蚀;黎明时分的热闹港口。

None

在这个例子中,大部分细节都给了渔夫,港口的描述则很简短。因此,生成的图像主要集中在渔夫身上,他在画面中占据主导地位,而背景(港口)则模糊且细节较少。

示例 2:背景优先

现在,让我们将焦点转向背景。将提示修改为:

黎明时分的热闹港口,渔船在水中摇晃,海鸥在空中盘旋;远处有一个渔夫,戴着磨损的帽子和毛衣,渔网搭在肩上。

None

在这里,港口的详细描述占据了优先地位。生成的图像将更关注港口,使其更加清晰,而渔夫在画面中显得较小且远离。通过简单地调整描述的顺序和重点,我们可以获得截然不同的结果。

关键要点

通过改变提示中每个元素的描述顺序细节程度,你可以控制图像中哪个部分成为焦点,以及背景的清晰度。

2. 内容如何影响背景清晰度

图像中背景的清晰度不仅受提示中细节程度的影响,还与背景内容本身有关。通过我对 Flux 模型的实验,我发现它的表现几乎像一个智能摄影师,会根据提示中描述的内容自动调整模糊程度。

让我们通过几个例子来探讨这一点,展示提示措辞如何影响背景的焦点和清晰度

示例 1:高度详细的背景,模糊的主体

考虑以下提示:

一个被高耸山峰环绕的雪山村庄,雪山上冒着烟的温馨小屋,滑雪者在洁白的坡道上划出轨迹;常青树上覆盖着新雪,清新的空气中充满了笑声和热可可的香气;一个滑雪者正在调整他的护目镜,呼出的气息在寒冷的空气中形成云雾,眼中闪烁着兴奋。

None

在这个提示中,大部分词汇集中在风景上——雪山村庄、山脉和常青树。由于风景的描述如此详细,生成的图像使背景显得大且非常清晰。而滑雪者则显得相对较小且遥远。尽管提到了他的动作,但由于他在图像中占据的空间很小,因此并没有很好地捕捉到。

这表明,背景与主体之间的细节量直接影响了每个元素在画面中的清晰度和大小。背景描述越详细,背景就越清晰和突出。

示例 2:通过简单调整将主体聚焦

现在,我们通过在滑雪者前添加“特写镜头”的短语来调整原始提示:

一个被高耸山峰环绕的雪山村庄,雪山上冒着烟的温馨小屋,滑雪者在洁白的坡道上划出轨迹;常青树上覆盖着新雪,清新的空气中充满了笑声和热可可的香气;__特写镜头 的滑雪者正在调整他的护目镜,呼出的气息在寒冷的空气中形成云雾,眼中闪烁着兴奋。

None

通过这个小调整,图像发生了显著变化。滑雪者现在变得更大,占据了更多的画面。背景依然清晰,但滑雪者现在成为了主要焦点,占据了前景。然而,尽管滑雪者更突出,但他调整护目镜的具体动作仍然没有完全捕捉到。

这引出了一个重要的观点:添加“特写”可以增加主体的大小,但并不一定使主体动作的每个细节都突出,尤其是当背景仍然相对详细时。

示例 3:减少背景细节以突出动作

让我们尝试另一个修改——这次减少背景的描述:

一个被雪覆盖的阿尔卑斯山村;一个滑雪者正在调整他的护目镜,呼出的气息在寒冷的空气中形成云雾,眼中闪烁着兴奋。

None

在这个提示中,我们显著减少了背景细节,更加关注滑雪者的动作。因此,生成的图像中滑雪者显得更加清晰,甚至捕捉到了他调整护目镜的具体动作。布局从远处的半身镜头转变为更近、更详细的全身镜头

然而,这也有一个权衡:背景变得更加模糊,因为不再详细描述。主体和背景清晰度之间的平衡受到提示中对每个部分关注程度的影响。

示例 4:改变主体顺序以获得不同布局

让我们进一步实验,将滑雪者放在提示的开头

一个滑雪者正在调整他的护目镜,呼出的气息在寒冷的空气中形成云雾,眼中闪烁着兴奋;一个被雪覆盖的阿尔卑斯山村。

None

在这个版本中,滑雪者的细节成为图像的主要焦点。他在画面中显得很大,描述中的所有细节——从他呼出的气息到眼中的兴奋——都得到了清晰的展现。与此同时,背景几乎不可见,严重模糊,占据的画面很少。

比较结果

通过比较这些不同提示生成的图像,你可以看到内容的顺序细节量直接影响了背景的清晰度主体的大小

  • 在第一个例子中,滑雪者远且小,而背景则清晰且详细。
  • 在第二个例子中,滑雪者变得更大,但他的动作仍然难以看清。
  • 在第三个例子中,我们清楚地看到滑雪者调整护目镜,但背景变得模糊。
  • 在第四个例子中,滑雪者主导了画面,背景几乎成了附带的。

你构建提示的方式和描述的顺序在控制主体大小背景清晰度方面起着重要作用。

这个差异可能看起来很明显,所以让我们再看几个图像对比。注意内容的顺序如何对整体布局产生重大影响?

None

None

None

影响显著的关键词

在这些例子中,一个显著的关键词是“特写镜头”。这是一个强有力的工具,可以将你的主体聚焦,使用它可以显著改变图像的构图。同样,使用像“在远处”“前景”这样的短语也可以调整主体和背景之间的焦点。这些短语使你能够微调生成图像的视角和平衡。

关键要点

你提示的内容直接影响背景的清晰模糊程度。当你添加更多详细的背景描述时,背景会变得更清晰和更大。如果你希望主体在画面中占主导地位,减少背景细节或将主体放在提示的开头将会改变焦点。

3. 通过关键词调整布局

提示中的某些关键词也可以直接控制主体占据的空间和背景的清晰度。这些关键词充当命令,改变图像的焦点。

特写镜头

将主体聚焦,使其更大且更详细,而背景则变得模糊。

None

None

在远处

将主体移得更远,使背景更突出且更清晰。

None

None

鸟瞰图

改变视角为更高、更远的视点,捕捉更多背景,减少主体的突出程度。

None

None

这些关键词为你提供了强大的控制能力,使你能够更轻松地创建所需的特定视觉效果。

4. 通过 LoRA 控制背景清晰度

在使用 Flux 模型生成图像时,常见的挑战是:当主体在画面中占据更多空间时,背景往往会变得过于模糊。这可能会造成问题,尤其是当背景在设定场景或增强图像整体氛围中起着关键作用时。

例如,看看这些图像:

None

None

那么,如何同时保持主体清晰背景清晰、详细呢?

一个选项是在提示中添加更多背景细节。然而,每次都写出长而复杂的提示并不总是理想的,尤其是当你想在详细的主体和清晰的背景之间保持平衡时,而不至于使提示过于繁琐。

引入 LoRA:更高效的解决方案

一种更高效的控制背景清晰度的方法是使用LoRA(低秩适应)。LoRA 允许你微调模型的行为,特别是如何对背景应用模糊,而不影响主体的大小或焦点。

LoRA 的工作原理

LoRA 本质上是一种轻量级的修改,可以将预训练模型适应你的特定需求,在这种情况下,减少背景模糊。当像 Flux 这样的模型的标准输出无法给你足够的背景清晰度控制时,它特别有用。

以下是你如何在工作流程中使用 LoRA。

在 ComfyUI 中设置 LoRA

为了简化过程,我为你在 ComfyUI 中设置了一个自定义工作流程。你可以在这里下载 工作流程反模糊 Flux loRA

工作流程概述

在工作流程的左侧,你会看到一个标准的 Flux 模型设置,但添加了一个用于LoRA的节点来管理背景模糊。以下是有效设置和使用 LoRA 的步骤:

None

  1. 加载 LoRA 节点:在预配置的 ComfyUI 工作流程中,你会看到 Flux 模型作为基础模型。然而,我添加了一个LoRA 节点,专门用于减少背景模糊。你可以根据需要调整 LoRA 的强度。为了演示,我将 LoRA 强度设置为最大值 2,但你可以根据需要调整此设置,以找到适合你图像的平衡。

  2. 使用更高效的 KSampler:我选择了一个更高效的 KSampler,而不是使用传统的KSampler(这是稳定扩散工作流程中的标准采样方法)。这有助于简化过程,并在使用 LoRA 时产生更干净的结果。

高分辨率修复工作流程

在工作流程的右侧,我们处理高分辨率修复,以进一步提高最终图像的清晰度和质量:

None

  • 首先,我们使用上采样潜在节点来提高图像的分辨率,增强其整体清晰度和锐度。
  • 然后,我们应用图像到图像的重绘,进一步精细化图像,确保任何剩余的模糊,尤其是在背景中,得到最小化。

并排比较:使用 LoRA 与不使用 LoRA

现在,让我们比较一组使用和不使用 LoRA 生成的图像:

None

None

None

None

  1. 第一张图像是使用Flux 模型而不使用 LoRA生成的。正如你所注意到的,尽管主体清晰且占据了画面的大部分,但背景却相当模糊。
  2. 第二张图像是应用了LoRA生成的。在这里,背景变得更加清晰,尽管主体在画面中仍占据相似的空间。LoRA 允许在不影响主体清晰度的情况下,提供更详细的背景。

通过将 LoRA 与高分辨率修复结合使用,结果是背景更加清晰、定义更明确。这种解决方案为解决使用 Flux 或类似模型时背景模糊的常见问题提供了实用和高效的方法。

自定义 LoRA 强度

使用 LoRA 的一个优点是你可以自定义其强度以满足你的特定需求。如果你发现背景仍然太模糊或太清晰,调整 LoRA 节点的强度将使你获得更精细的控制。这种灵活性使你能够生成在主体焦点和背景细节之间达到完美平衡的图像。

尝试在下一个图像生成项目中应用 LoRA,看看它带来的不同吧!

结论

总结一下,以下是控制 Stable Diffusion 图像布局和清晰度的关键技巧:

  1. 调整提示中的细节程度以控制主体的大小和背景的清晰度。
  2. 改变描述的顺序以在主体和背景之间转移焦点。
  3. 使用像“特写镜头”或“在远处”这样的关键词来微调布局和视角。
  4. 如果在关注主体时背景变得过于模糊,使用LoRA来增强背景清晰度,而不牺牲主体大小。

通过这些技巧,你将对图像的构图有更大的控制能力,使你能够创建出你所追求的确切视觉风格。

希望你觉得这些技巧有帮助!现在轮到你来实验提示,看看你能创造出什么。祝你生成愉快!

推荐阅读:

FluxAI 中文

© 2025. All Rights Reserved