追逐像素:我与 Midjourney AI 和马图像的疯狂旅程


7 个月前

你有没有尝试过驾驭一群数字化的马群?这篇关于 Midjourney 的案例研究将带你了解我如何通过各种提示和技巧重现一幅令人惊叹的马的图像。我们将探讨 Midjourney 的能力和局限性,从基本的文本提示到高级的风格参考。无论你是 AI 艺术的老手还是好奇的初学者,你都会找到实用的建议,帮助你在 Midjourney 的冒险中取得成功。

剧透警告:这并不是一帆风顺,但却是一次充满教育意义的体验!让我们深入探讨,一次创造一匹马。

起跑线:一幅令人印象深刻的图像

None

EJ Yao 使用 Midjourney V6.1 制作

一切始于上面这幅图像——三匹雄伟的马在尘土飞扬的平原上奔跑,肌肉在戏剧性的天空下波动。这可不是普通的库存照片。这是 Midjourney AI 展现其数字实力,创造出一幅如此逼真的图像,完全可以当作专业摄影作品。

光线锐利,阴影分明,形成了一个高对比度的场景,几乎充满了能量。你几乎能感受到地面在这些虚拟骏马奔腾时的震动。这是艺术,这是摄影,这……是 AI 的巅峰之作。

当然,我想要更多。创造这个主题的变体有多难呢?

尝试 #1:沉默的处理

None

EJ Yao 使用 Midjourney V6.1 制作,提示如下:

https://s.mj.run/POhojvBS7y8 "" --ar 16:9 --quality 2 --v 6.1

我第一个聪明的主意?用这幅图像作为提示,不加任何文字。Midjourney 肯定会理解我想要什么,对吧?

错了。结果就像一匹小马试图赢得肯塔基德比一样令人失望。没有文本指导,我们的 AI 朋友似乎迷失了方向,生成的图像更像是“梦游”而非“精美艺术”。教训是:Midjourney,就像一匹顽固的种马,需要明确的方向。

尝试 #2:找到合适的词汇

[在这里插入一张稍微改进但仍然偏离目标的结果图]

None

EJ Yao 使用 Midjourney V6.1 制作,提示如下:

https://s.mj.run/POhojvBS7y8 Photo of Horses galloping 
through stormy landscape, dark clouds, wind-whipped manes, 
dramatic lighting --ar 16:9 --quality 2 --v 6.1

在我的第二次尝试中,我将原始图像作为图像提示,并在 Midjourney AI 中添加了额外的文本描述。尽管使用了视觉和文本输入,结果仍然没有完全捕捉到原始图像的精髓。

AI 生成的结果虽然令人印象深刻,但与原始图像的本质有所偏离。原始图像在明亮的光线下捕捉到了宁静而又充满活力的能量,而新图像则倾向于更戏剧化和强烈的场景。重要的是,原始图像更关注马匹,突出了它们光滑的毛发和优雅的外观,颜色和谐地融入明亮的沙色背景。相比之下,AI 输出则强调了更高的对比度和更强劲的马匹,背景则显得戏剧化。虽然原始图像在清晰度和流畅的马匹动作与微妙的背景之间取得了平衡,但 AI 版本则倾向于原始力量和强度,掩盖了我想要重现的马匹与环境之间的细腻互动。

尝试 #3:呼叫增援(ChatGPT)

在寻找完美提示的过程中,我求助于 ChatGPT。“分析这幅图像,作为 Midjourney AI 提示工程师,请给我提供 3 个版本的提示来重现它。”

ChatGPT 凭借其强大的语言处理和图像分析能力,提供了详细的描述和建议。带着这些新提示,我满怀希望地回到了 Midjourney。

结果在其自身的意义上也令人印象深刻——美丽而充满活力的马的图像展示了 Midjourney 的能力。然而,它们仍然没有完全捕捉到我所追求的原始图像的特定风格和本质。

突破:风格参考

None

EJ Yao 使用 Midjourney V6.1 制作,提示如下:

Photo of Horses galloping through stormy landscape, 
dark clouds, wind-whipped manes, dramatic lighting 
--ar 16:9 --quality 2 --sref https://s.mj.run/POhojvBS7y8 --v 6.1

最终,我偶然发现了风格参考的概念。现在我们有话说了!但等等——对于多匹马,角色参考会不会更有效?

情节反转:对于 Midjourney 6.1,角色参考最适合单个角色。是的,Midjourney 团队在他们的每周办公时间中提到,角色参考功能的增强正在进行中。

所以,就用风格参考吧。哇,事情变得有趣了。对我来说,Midjourney AI 大大增强了图像。这就像许多图像编辑软件中的自动增强向导,但效果好 200%。

金发姑娘区:找到合适的权重

使用风格参考,我感觉像个疯狂的科学家,不断调整和修改:

  • 风格权重在 20+:图像看起来像参考的双胞胎。如果你想要复制,这很好,但对于变体就不太好了。
  • 风格权重在 10:影响仍然太强。我的数字马更像是“克隆”而非“灵感来源”。

None

EJ Yao 使用 Midjourney V6.1 制作,提示如下:

Photo of Horses galloping through stormy landscape, 
dark clouds, wind-whipped manes, dramatic lighting 
--ar 16:9 --quality 2 
--sref https://s.mj.run/POhojvBS7y8 --sw 5 --v 6.1
  • 风格权重在 5:成功!我们找到了最佳点。结果既足够独特,又能捕捉到精髓。马匹的肌肉线条、鬃毛和蹄子的细节得到了强调,展示了动物的美丽和力量。

终点线:学到的教训

这段旅程教会了我不仅仅是如何生成漂亮的马的图片。这是一次关于 AI 艺术生成细微差别的速成课程:

  1. 清晰的沟通是关键。AI,像任何艺术家一样,需要方向。
  2. 有时候,少即是多。过度描述可能会让 AI 和不足描述一样困惑。
  3. 实验至关重要。对一幅图像有效的方法 可能不适用于 另一幅。
  4. 理解工具(例如角色和风格参考之间的区别)可以决定你的结果成败。

当我坐下来欣赏我的数字马群——每匹马都是独一无二的,却又捕捉到了那幅令人惊叹的原始图像的精神——我不禁感到一阵成就感。这并不容易,但值得的事情从来都不是轻而易举的。

所以,亲爱的 AI 艺术爱好者们,我鼓励你们骑上马,开始你们自己的旅程。谁知道你们可能创造出什么数字奇迹?只要记住:当情况变得困难时,调整你的提示,继续向前奔跑!

你是否也在进行自己的 AI 艺术冒险?在下面的评论中分享你的经历吧!如果你喜欢这次数字平原的探索,请点赞并关注以获取更多 AI 驱动的趣事。让我们把这个社区发展到 1000 人的规模!

FluxAI 中文

© 2025. All Rights Reserved