Flux.1:正在引爆互联网的 AI 图像生成器
7 个月前
Flux:颠覆性的图像生成工具
这款工具叫做 Flux,真是太疯狂了。
它是一个改变游戏规则的工具,朋友们。
想象一下,你可以在不拿起相机或画笔的情况下,创造出专业级的图像。
这就是 Flux 的力量。
数字艺术界已经开始注意到这一点。Flux 生成的结果甚至比 Midjourney 更好,更不用说 DALL-E3 和 Stable Diffusion 了。
在这篇文章中,我将探讨 Flux 以及如何今天就开始使用它,并将其与其他流行的 AI 图像模型进行比较。
什么是 Flux?
Flux,正式名称为 Flux.1,是一个文本到图像的模型套件,代表了 AI 图像生成的重大进步。
它由 Black Forest Labs 的一些天才开发,Flux 是一个 AI 模型,可以仅通过简单的文本描述生成令人惊叹的逼真图像。
我们说的是那些好到让你觉得它们是真实的图像。
但这里有个关键点——Flux 不是某个封闭的大型科技公司的秘密。它是开源的,这意味着任何人都可以访问、使用,甚至自定义它。
Flux 的变体
Flux 主要有三种变体,每种都针对不同的使用场景:
- Flux.1 Pro 是旗舰模型,提供最先进的图像生成性能。它在提示遵循、视觉质量、图像细节和输出多样性方面表现出色。
- Flux.1 Dev 是一个开放权重、经过指导提炼的模型,旨在非商业用途。它的质量与 Pro 版本相似,同时更高效。
- Flux.1 Schnell 是该套件中速度最快的模型。它专为本地开发和个人使用而设计,并在 Apache 2.0 许可证下公开提供。
经过对所有 Flux 模型的测试,我个人最喜欢 Dev 模型。它能快速生成令人惊叹的图像,而不需要太多的提示工程。
最终,你可以用 Pro 模型获得最佳结果,但它更难驾驭。
Schnell 模型生成的图像质量明显较低。
Flux 与 Stable Diffusion 和 DALL-E3 的对比
我敢打赌你想知道 Flux 的图像质量与其他流行的 AI 图像模型相比如何。
让我们来看看。
我在这次测试中使用了 Flux、Stable Diffusion XL 和 OpenAI 的 DALL-E3。
示例 1:逼真的肖像
提示:"一位年迈的西藏僧侣的特写肖像,皮肤粗糙,眼神温和,穿着传统的红色长袍。他微笑着看向镜头。图像应有柔和自然的光线,捕捉到他脸上的每一个细节,包括皱纹和灰色的胡须。背景稍微模糊,显示出一个模糊的西藏寺庙。风格:高分辨率摄影,类似于国家地理的肖像。"
💡提示:使用 — -aspect 参数 来调整 Flux 中图像的宽高比,例如:
--aspect 16:9
--aspect 1:1
1. 使用 Flux Dev 生成的图像
2. 使用 Stable Diffusion 生成的图像 — 哎呀!
3. 使用 DALL-E3 生成的图像
在我看来——Flux 显然赢了这一轮。我也更喜欢 DALL-E3 生成的图像,而不是 Stable Diffusion 的。
Flux 在逼真图像方面表现出色。
示例 2:抽象艺术
提示:"气候变化的抽象表现。使用冷色调的蓝色和绿色过渡到温暖的橙色和红色。融入类似融化冰块、海平面上升和工业烟囱的形状。构图应动态且引人深思,带有紧迫感。风格:现代抽象艺术,受瓦西里·康丁斯基的色彩理论和形状启发。"
1. 使用 Flux Dev 生成的图像
2. 使用 Stable Diffusion 生成的图像
3. 使用 DALL-E3 生成的图像
这场较量更难以评判,因为这是艺术。如果你是毕加索的粉丝,你可能会喜欢使用 Stable Diffusion 生成的图像,但我个人仍然更喜欢 Flux。
我将胜者留给你来决定。
示例 3:产品广告
提示:"一款流线型、未来感十足的智能手表,展示在反光表面上。手表表盘显示出各种应用图标的全息投影漂浮在上方。微妙的光线穿过图像,暗示速度和创新。背景是深蓝色到紫色的渐变。标语为:'未来在你的手腕上'。风格:高端产品摄影,带有 CGI 增强,类似于苹果或三星的广告。"
1. 使用 Flux Pro 生成的图像
2. 使用 Stable Diffusion 生成的图像
3. 使用 DALL-E3 生成的图像
在我看来,这一轮的胜者显而易见:Flux,因为其他模型没有正确生成图中的文本,而图像看起来像是一则广告。
总之,你可以用 Flux 创建令人惊叹的逼真图像。为了获得最佳结果,你需要调整你的提示,有时还需要在 Dev 和 Pro 模型之间切换。
主要特点和能力
是什么让 Flux 在众多 AI 图像生成器中脱颖而出?
以下是一些关键特点,供感兴趣的朋友参考:
- 12 亿个参数使 Flux 能够生成高度详细和细腻的图像。
- 与许多专有模型不同,Flux 的开源方法允许更大的透明度和社区驱动的改进。
- Flux 使用多模态和并行扩散变换器块的混合,增强了其效率和输出质量。
- 流匹配技术改善了生成模型的训练,导致更好的图像质量。
- 旋转位置嵌入特性增强了模型的性能和硬件效率。
如何访问 Flux
Flux 的一个优势是其可访问性。有几个平台可以访问 Flux,包括:
1. Fal.ai
Fal.ai 提供了一个用户友好的界面来与 Flux 互动。以下是开始使用的步骤:
- 在 fal.ai 上创建一个账户(你需要一个 GitHub 账户来登录)。
- 选择“FLUX Realism LoRA”模型。
- 用英语写下你的提示。
- 点击“更多”以显示其他选项。
- 将“推理步骤数量”从 28 改为 48,以获得更好的质量。
- 点击“运行”生成你的图像。
2. Poe
Poe 是另一个平台,提供对 Flux 的访问。
通过每月 19.99 美元的订阅,你可以在 Poe 内部使用 Flux 创建大量图像。
具体有多少,让我们来看看:
你将获得 1,000,000 计算点的月度订阅。
- 使用 Flux Pro,每个提示消耗 1,250 计算点,这意味着你可以在一个月内创建 800 张图像。
- 使用 Flux Dev,每个提示消耗 625 计算点,这意味着你可以在一个月内创建 1,600 张图像。
- 使用 Flux Schnell,每个提示消耗 75 计算点,这意味着你可以在一个月内创建 13,300 张图像。
💡提示:在 Poe 中,Num inference 参数默认是 40,因此你可以轻松获得非常好的结果。
3. Replicate
Replicate 也提供了使用 Flux 的接口。Replicate 通常用户友好,类似于其他 AI 模型接口。
4. HuggingFace
HuggingFace 是一个流行的 AI 模型平台,也托管了 Flux。你可以通过他们的接口找到并访问该模型。
5. Grok 2.0
Grok 2.0 现已向 X Premium 和 Premium+ 订阅者开放,并且现在集成了 Flux。此集成允许用户直接在 X 应用的 Grok 标签中从文本提示生成高质量图像。
开发者的 API 访问
对于希望将 Flux 集成到自己应用程序中的开发者,API 访问是可用的。API 目前处于预览模式,有一些限制,但为开发者提供了令人兴奋的可能性。
如何有效使用 Flux
为了充分利用 Flux,你需要编写描述性的提示。以下是优化结果的提示结构指南:
- 从主题的身体特征开始。
- 描述主题正在做什么以及他们的姿势(如果适用)。
- 指定主题所在的环境。
- 添加具体细节以细化图像。
- 描述你想传达的整体氛围。
- 解释场景中发生了什么或主要主题。
- 指明特定的风格或视觉参考。
示例提示(fal.ai 默认):_"一张美丽的微笑的棕发女孩的照片,长发扎成凌乱的马尾,穿着一条色彩鲜艳的裙子,脖子上挂着蓝色的挂绳,手里拿着一块写着 '我爱明天理论' 的牌子,站在 TedX 舞台上。她微笑着与观众交谈。她身后是一面白色的墙,上面有一个黄色的谷歌标志。她的身材很好。她的眼睛看起来像是有一些有趣或聪明的想法。整体氛围传达出自信和决心,因为她与来自各行各业的人分享关于 AI 技术的知识,风格类似于 TedX 演讲。"**
💡提示:你可以使用一个生成器来为 Flux 制作完美的提示,或者使用像 ChatGPT 或 Claude 这样的 AI 工具来帮助创建提示。
提升 Flux 输出质量
为了进一步提高 Flux 生成图像的质量,可以采用两种关键技术:
LoRA(低秩适应)
LoRA 是一种允许 AI 模型针对特定风格或主题进行微调的技术。当与 Flux 一起使用时,它可以增强生成图像的真实感。
在 fal.ai 上,已经集成了带有 LoRA 的 Flux 模型;使用“FLUX Realism LoRA”选项,并将“推理步骤数量”从 28 增加到 48。
Rendernet 进一步增强
在使用 Flux 生成图像后,你可以使用像 Rendernet 这样的工具进一步提高真实感。
以下是快速指南:
- 在 Rendernet 上创建一个账户。
- 上传你的 Flux 生成的图像。
- 将“真实感强度”设置为“高”。
- 将“缩放因子”保持在“2x”。
- 点击“增强”,等待处理。
这个额外的步骤通常可以将你的 Flux 生成的图像提升到下一个逼真水平。
伦理考虑
与任何强大的 AI 工具一样,你需要以道德的方式使用图像,以避免任何后果。以下是一些关键的伦理考虑:
- 避免在未获得许可的情况下创建真实人物的图像。
- 不要使用 AI 生成的图像来创建或传播虚假信息。
- 避免创建冒犯性、歧视性或不当内容。
- 在分享时始终明确图像是 AI 生成的。
- 对受保护品牌或角色的引用要谨慎。
未来展望
Flux 代表了 AI 图像生成向真实感的重大飞跃。
随着 AI 模型的不断改进,我预测 2025 年将是 AI 生成图像和视频的突破年,我们将不再能够区分事实与虚构。
FluxAI 中文
© 2025. All Rights Reserved