哪个 Flux 模型最好?我在 5 个关键领域测试了 4 个 Flux 模型——以下是获胜者。
5 个月前
在生成了超过 100,000 张图像后,我删除了我的 Midjourney 账户。让我来解释一下原因……
我非常喜欢在 Midjourney 仅通过 Discord 可用时使用它。我喜欢它不强迫我看到其他用户正在创作的内容。我也很感激我可以在自己的空间中创作,而不需要分享我所创作的内容。
当 Alpha 网站上线时,我非常兴奋,喜欢社交图像生成的概念。我很高兴能成为第一批获得访问权限的人。但随着时间的推移,我感到越来越孤立,因为我觉得标准在下降,而我在主页上看到的内容过于性暗示,几乎接近裸露。
我爱我的妻子,并且对她忠诚。我最终决定不想把自己置于一个我所创作和看到的内容让我在纯真与背叛之间徘徊的地方。
我不知道 Midjourney 的标准是否下降,还是这种类型的内容一直存在,但没有在他们的主页上公开展示。似乎几乎所有流行的 AI 艺术生成工具都有类似的问题,尤其是那些有社交或社区性质的工具。你是否在 AI 艺术平台上也有类似的担忧?在下面留言分享你的想法。
这一切促使我探索替代方案——我发现的正是我所寻找的。
进入 Flux — 颠覆 AI 艺术游戏的新秀
Black Forest Labs 制作了一些非常出色的模型,似乎在我退出 Midjourney 的同时出现。我也查看了 Stable Diffusion,但这与本文无关,因为我不会在 Flux、Midjourney 和 Stable Diffusion 之间进行比较。
相反,我将分享我今天测试的 4 个主要 Flux 模型:Flux Schnell、Flux Dev、Flux Pro 1.0 和 Flux Pro 1.1。我还将分享我生成的 80 张图像以及我用于比较的关键领域。
大 Flux 对决:测试方法论
我最初进入 Flux 世界时认为 Schnell 和 Dev 模型不值得我花时间,认为只有使用 Flux Pro 1.0 才能获得最佳结果(当时 1.1 还不存在)。最终,我尝试了 Schnell 和 Dev,发现它们在创建图像时都是非常强大且可行的选择。
那么,如果 Schnell 和 Dev 都是可行的并且能够创建高质量的图像,哪个模型是“最佳”的?
“最佳”到底是什么意思?是指输出最高质量图像、细节丰富和复杂图案的模型吗?是指使用颜色最好的模型吗?还是在各种提示中产生一致质量的模型?
为了回答这些问题,我开始为每个模型生成 1 张来自相同提示的图像,每个提示生成 4 张图像,使用 20 个不同的提示,总共生成 80 张图像。在这一点上,我还没有决定“最佳”的含义,因为我不想在创建图像时引入任何偏见,因为我也将对它们进行评分。
一旦我创建了所有图像,我定义了我将对每个模型进行评分的关键领域。我使用的 5 个关键领域是:
- 📐 视觉一致性与构图
- 🎨 细节与复杂性
- 🌈 颜色使用与和谐
- 🎭 风格元素的遵循
- 💡 创造力与独特性
我为每张图像在每个关键领域分配了 1 到 5 的分数,然后对每个模型和关键领域的分数进行平均,以得出每个关键领域评估的图像的平均值。(1 = 关键领域在图像中完全没有体现,5 = 关键领域在图像中完全体现。)
现在,我将分享我使用的 20 个提示以及每个模型生成的结果图像。我还要指出,在这 20 个不同的提示中,我要求使用独特的媒介,以便展示每个模型在生成各种媒介和风格图像方面的能力。
让我们来看看测试图像和发现。我对我的发现感到惊讶。
1. 照片
提示:一张长曝光的美丽森林瀑布照片,周围环绕着悬挂的西班牙苔藓,阳光透射,美丽的阳光,蜿蜒的小溪
Schnell
Dev
Pro 1.0
Pro 1.1
2. 插图
提示:1960 年代的咖啡杯插图,复古艺术,1960 年代艺术,数字艺术,矢量图形,插图,绘画,漫画,纹身,数字绘画,手绘,手工制作,工艺风格,原创艺术,复古 T 恤设计
Schnell
Dev
Pro 1.0
Pro 1.1
3. 绘画
提示:沙漠中的西班牙别墅,屋顶流出瀑布,毕加索油画,柔和的色彩
Schnell
Dev
Pro 1.0
Pro 1.1
4. 纸艺
提示:日本的伟大波浪纸艺,色调主义色彩方案,鲜明的卡通石版画,深色反射,生动的插图,新马赛克,彼得·米切夫
Schnell
Dev
Pro 1.0
Pro 1.1
5. 铅笔素描
提示:戴眼镜的小猪铅笔素描
Schnell
Dev
Pro 1.0
Pro 1.1
6. 水彩画
提示:水彩画松树和山脉
Schnell
Dev
Pro 1.0
Pro 1.1
7. 粉笔艺术
提示:一片黄色蒲公英和蝴蝶的田野,粉笔艺术
Schnell
Dev
Pro 1.0
Pro 1.1
8. 禅墨
提示:宁静的湖泊在森林中,禅墨
Schnell
Dev
Pro 1.0
Pro 1.1
9. 视觉错觉
提示:视觉错觉,三环马戏团表演中的大象
Schnell
Dev
Pro 1.0
Pro 1.1
10. 混合媒介马赛克
提示:日落时分的广袤绿色丘陵的混合媒介马赛克
Schnell
Dev
Pro 1.0
Pro 1.1
11. 涂鸦
提示:穿着红色衬衫的卡通狗涂鸦艺术
Schnell
Dev
Pro 1.0
Pro 1.1
12. 数字艺术
提示:沼泽中兔子的数字艺术,黑色和黄色色彩方案
Schnell
Dev
Pro 1.0
Pro 1.1
13. 像素艺术
提示:一个具有挑战性的视频游戏关卡,2D 横向卷轴,像素艺术
Schnell
Dev
Pro 1.0
Pro 1.1
14. 木刻版画
提示:一棵大树上的树屋木刻版画
Schnell
Dev
Pro 1.0
Pro 1.1
15. 湿画油画
提示:湿画油画中的小屋,远处的山脉
Schnell
Dev
Pro 1.0
Pro 1.1
16. 钢笔与墨水
提示:自然中一只猫头鹰对着火鸡尖叫的钢笔与墨水插图
Schnell
Dev
Pro 1.0
Pro 1.1
17. 喷枪画
提示:喷枪艺术中的蓝色金翅雀栖息在带有浆果和叶子的树枝上
Schnell
Dev
Pro 1.0
Pro 1.1
18. 石雕
提示:美丽雕塑花园中的贵宾犬石雕
Schnell
Dev
Pro 1.0
Pro 1.1
19. 石墨素描
提示:天空中飞行中的超级英雄石墨素描
Schnell
Dev
Pro 1.0
Pro 1.1
20. 滴落的油漆
提示:滴落的油漆静物画,装满水果的篮子
Schnell
Dev
Pro 1.0
Pro 1.1
这就是我为每张图像和关键领域分配的分数。那么,这一切意味着什么呢?让我们看看所有这些数字的平均值。
从这些数据中得出的一些关键结论:
- 平均值的范围相当小——低与高之间仅有 0.55。在这次实验之后,我会觉得根据我的需求使用这四个模型中的任何一个都很舒服。如果考虑到成本,我宁愿节省一些钱,使用通常较便宜的 Schnell 或 Dev 模型,并将 Pro 模型留给精细调整的提示。
- 从 Pro 1.0 升级到 Pro 1.1 提供了相当不错的改进,并且在生成你想要的内容时将是最可靠的——只要你有一个强有力的提示。
- Schnell 在关键领域的表现通常略逊于其他 3 个模型,除了 在“风格元素的遵循”方面,它的表现优于其他模型。
- Pro 1.1 在关键领域的表现通常略优于其他 3 个模型,除了在“颜色使用与和谐”方面,Pro 1.0 的平均分略高。
我从这次测试中得出了一些非量化的发现:
- 在提示时,如果将所要求的风格或媒介放在提示的前面,生成的图像更有可能遵循该风格或媒介。
- Flux 在填补提示中的细节空白方面做得非常好,能够生成一种非常自然的图像,而不会出现未提示的奇怪细节。
我很好奇你的想法。你自己测试过不同的 Flux 模型吗?
感谢你陪我看到最后!希望你喜欢这些图像和发现。
推荐阅读:
FluxAI 中文
© 2025. All Rights Reserved