Flux.1:正在引爆互联网的 AI 图像生成器


7 个月前

Flux:颠覆性的图像生成工具

这款工具叫做 Flux,真是太疯狂了。

它是一个改变游戏规则的工具,朋友们。

想象一下,你可以在不拿起相机或画笔的情况下,创造出专业级的图像。

这就是 Flux 的力量。

数字艺术界已经开始注意到这一点。Flux 生成的结果甚至比 Midjourney 更好,更不用说 DALL-E3 和 Stable Diffusion 了。

在这篇文章中,我将探讨 Flux 以及如何今天就开始使用它,并将其与其他流行的 AI 图像模型进行比较。

什么是 Flux?

Flux,正式名称为 Flux.1,是一个文本到图像的模型套件,代表了 AI 图像生成的重大进步。

它由 Black Forest Labs 的一些天才开发,Flux 是一个 AI 模型,可以仅通过简单的文本描述生成令人惊叹的逼真图像。

我们说的是那些好到让你觉得它们是真实的图像。

但这里有个关键点——Flux 不是某个封闭的大型科技公司的秘密。它是开源的,这意味着任何人都可以访问、使用,甚至自定义它。

Flux 的变体

Flux 主要有三种变体,每种都针对不同的使用场景:

  1. Flux.1 Pro 是旗舰模型,提供最先进的图像生成性能。它在提示遵循、视觉质量、图像细节和输出多样性方面表现出色。
  2. Flux.1 Dev 是一个开放权重、经过指导提炼的模型,旨在非商业用途。它的质量与 Pro 版本相似,同时更高效。
  3. Flux.1 Schnell 是该套件中速度最快的模型。它专为本地开发和个人使用而设计,并在 Apache 2.0 许可证下公开提供。

经过对所有 Flux 模型的测试,我个人最喜欢 Dev 模型。它能快速生成令人惊叹的图像,而不需要太多的提示工程。

最终,你可以用 Pro 模型获得最佳结果,但它更难驾驭。

Schnell 模型生成的图像质量明显较低。

Flux 与 Stable Diffusion 和 DALL-E3 的对比

我敢打赌你想知道 Flux 的图像质量与其他流行的 AI 图像模型相比如何。

让我们来看看。

我在这次测试中使用了 Flux、Stable Diffusion XL 和 OpenAI 的 DALL-E3。

示例 1:逼真的肖像

提示:"一位年迈的西藏僧侣的特写肖像,皮肤粗糙,眼神温和,穿着传统的红色长袍。他微笑着看向镜头。图像应有柔和自然的光线,捕捉到他脸上的每一个细节,包括皱纹和灰色的胡须。背景稍微模糊,显示出一个模糊的西藏寺庙。风格:高分辨率摄影,类似于国家地理的肖像。"

💡提示:使用 — -aspect 参数 来调整 Flux 中图像的宽高比,例如:

--aspect 16:9
--aspect 1:1

1. 使用 Flux Dev 生成的图像

None

2. 使用 Stable Diffusion 生成的图像 — 哎呀!

None

3. 使用 DALL-E3 生成的图像

None

在我看来——Flux 显然赢了这一轮。我也更喜欢 DALL-E3 生成的图像,而不是 Stable Diffusion 的。

Flux 在逼真图像方面表现出色。

示例 2:抽象艺术

提示:"气候变化的抽象表现。使用冷色调的蓝色和绿色过渡到温暖的橙色和红色。融入类似融化冰块、海平面上升和工业烟囱的形状。构图应动态且引人深思,带有紧迫感。风格:现代抽象艺术,受瓦西里·康丁斯基的色彩理论和形状启发。"

1. 使用 Flux Dev 生成的图像

None

2. 使用 Stable Diffusion 生成的图像

None

3. 使用 DALL-E3 生成的图像

None

这场较量更难以评判,因为这是艺术。如果你是毕加索的粉丝,你可能会喜欢使用 Stable Diffusion 生成的图像,但我个人仍然更喜欢 Flux。

我将胜者留给你来决定。

示例 3:产品广告

提示:"一款流线型、未来感十足的智能手表,展示在反光表面上。手表表盘显示出各种应用图标的全息投影漂浮在上方。微妙的光线穿过图像,暗示速度和创新。背景是深蓝色到紫色的渐变。标语为:'未来在你的手腕上'。风格:高端产品摄影,带有 CGI 增强,类似于苹果或三星的广告。"

1. 使用 Flux Pro 生成的图像

None

2. 使用 Stable Diffusion 生成的图像

None

3. 使用 DALL-E3 生成的图像

None

在我看来,这一轮的胜者显而易见:Flux,因为其他模型没有正确生成图中的文本,而图像看起来像是一则广告。

总之,你可以用 Flux 创建令人惊叹的逼真图像。为了获得最佳结果,你需要调整你的提示,有时还需要在 Dev 和 Pro 模型之间切换。

主要特点和能力

是什么让 Flux 在众多 AI 图像生成器中脱颖而出?

以下是一些关键特点,供感兴趣的朋友参考:

  • 12 亿个参数使 Flux 能够生成高度详细和细腻的图像。
  • 与许多专有模型不同,Flux 的开源方法允许更大的透明度和社区驱动的改进。
  • Flux 使用多模态和并行扩散变换器块的混合,增强了其效率和输出质量。
  • 流匹配技术改善了生成模型的训练,导致更好的图像质量。
  • 旋转位置嵌入特性增强了模型的性能和硬件效率。

如何访问 Flux

Flux 的一个优势是其可访问性。有几个平台可以访问 Flux,包括:

1. Fal.ai

Fal.ai 提供了一个用户友好的界面来与 Flux 互动。以下是开始使用的步骤:

  1. 在 fal.ai 上创建一个账户(你需要一个 GitHub 账户来登录)。
  2. 选择“FLUX Realism LoRA”模型。
  3. 用英语写下你的提示。
  4. 点击“更多”以显示其他选项。
  5. 将“推理步骤数量”从 28 改为 48,以获得更好的质量。
  6. 点击“运行”生成你的图像。

2. Poe

Poe 是另一个平台,提供对 Flux 的访问。

通过每月 19.99 美元的订阅,你可以在 Poe 内部使用 Flux 创建大量图像。

具体有多少,让我们来看看:

你将获得 1,000,000 计算点的月度订阅。

  • 使用 Flux Pro,每个提示消耗 1,250 计算点,这意味着你可以在一个月内创建 800 张图像。
  • 使用 Flux Dev,每个提示消耗 625 计算点,这意味着你可以在一个月内创建 1,600 张图像。
  • 使用 Flux Schnell,每个提示消耗 75 计算点,这意味着你可以在一个月内创建 13,300 张图像。

💡提示:在 Poe 中,Num inference 参数默认是 40,因此你可以轻松获得非常好的结果。

3. Replicate

Replicate 也提供了使用 Flux 的接口。Replicate 通常用户友好,类似于其他 AI 模型接口。

4. HuggingFace

HuggingFace 是一个流行的 AI 模型平台,也托管了 Flux。你可以通过他们的接口找到并访问该模型。

5. Grok 2.0

Grok 2.0 现已向 X Premium 和 Premium+ 订阅者开放,并且现在集成了 Flux。此集成允许用户直接在 X 应用的 Grok 标签中从文本提示生成高质量图像。

开发者的 API 访问

对于希望将 Flux 集成到自己应用程序中的开发者,API 访问是可用的。API 目前处于预览模式,有一些限制,但为开发者提供了令人兴奋的可能性。

如何有效使用 Flux

为了充分利用 Flux,你需要编写描述性的提示。以下是优化结果的提示结构指南:

  1. 从主题的身体特征开始。
  2. 描述主题正在做什么以及他们的姿势(如果适用)。
  3. 指定主题所在的环境。
  4. 添加具体细节以细化图像。
  5. 描述你想传达的整体氛围。
  6. 解释场景中发生了什么或主要主题。
  7. 指明特定的风格或视觉参考。

示例提示(fal.ai 默认):_"一张美丽的微笑的棕发女孩的照片,长发扎成凌乱的马尾,穿着一条色彩鲜艳的裙子,脖子上挂着蓝色的挂绳,手里拿着一块写着 '我爱明天理论' 的牌子,站在 TedX 舞台上。她微笑着与观众交谈。她身后是一面白色的墙,上面有一个黄色的谷歌标志。她的身材很好。她的眼睛看起来像是有一些有趣或聪明的想法。整体氛围传达出自信和决心,因为她与来自各行各业的人分享关于 AI 技术的知识,风格类似于 TedX 演讲。"**

None

💡提示:你可以使用一个生成器来为 Flux 制作完美的提示,或者使用像 ChatGPT 或 Claude 这样的 AI 工具来帮助创建提示。

提升 Flux 输出质量

为了进一步提高 Flux 生成图像的质量,可以采用两种关键技术:

LoRA(低秩适应)

LoRA 是一种允许 AI 模型针对特定风格或主题进行微调的技术。当与 Flux 一起使用时,它可以增强生成图像的真实感。

在 fal.ai 上,已经集成了带有 LoRA 的 Flux 模型;使用“FLUX Realism LoRA”选项,并将“推理步骤数量”从 28 增加到 48。

Rendernet 进一步增强

在使用 Flux 生成图像后,你可以使用像 Rendernet 这样的工具进一步提高真实感。

以下是快速指南:

  1. 在 Rendernet 上创建一个账户。
  2. 上传你的 Flux 生成的图像。
  3. 将“真实感强度”设置为“高”。
  4. 将“缩放因子”保持在“2x”。
  5. 点击“增强”,等待处理。

这个额外的步骤通常可以将你的 Flux 生成的图像提升到下一个逼真水平。

伦理考虑

与任何强大的 AI 工具一样,你需要以道德的方式使用图像,以避免任何后果。以下是一些关键的伦理考虑:

  • 避免在未获得许可的情况下创建真实人物的图像。
  • 不要使用 AI 生成的图像来创建或传播虚假信息。
  • 避免创建冒犯性、歧视性或不当内容。
  • 在分享时始终明确图像是 AI 生成的。
  • 对受保护品牌或角色的引用要谨慎。

未来展望

Flux 代表了 AI 图像生成向真实感的重大飞跃。

随着 AI 模型的不断改进,我预测 2025 年将是 AI 生成图像和视频的突破年,我们将不再能够区分事实与虚构。

最初发表于 于 2024 年 8 月 20 日。

FluxAI 中文

© 2025. All Rights Reserved