FLUX.1 — 文本到图像领域的新兴选择


10 个月前

FLUX.1 — 文本到图像模块中的新成员

图片来自 <

https://www.basedlabs.ai/tools/flux1>或者我应该说,新的成年人?无论你选择什么,图像生成技术都将长期存在。在这篇文章中,我们讨论了最近发布的文本到图像模型FLUX.1,它震撼了科技界。 介绍

在过去的一周里,任何社交媒体平台上的一分钟滚动都会展示一位年轻女性在会议上发言的图片。如果不是因为引人注目的标题——你知道吗,这是一张AI生成的图片?——我可能就会滚动过去了。 到目前为止,图像生成工具一直在与以下问题作斗争,这些问题使得人们很容易识别出它们是人工智能生成的。 * 生成人类图像 - 通常,看一眼就能很容易地识别出图像是AI生成的。尤其是手部 - 有时手指合并在一起,有时手指超过5个,奇怪的动作等等。OpenAI的SoRA和DALL-E也有这个问题。 * 图片中的文字 — 打开DALL·E并提示它生成一张带有“欢迎来到我们的家”写在木门上的图片。你会发现,通常拼写是错误的,单词缺失,或者有时文本完全缺失。 FLUX

Flux 是一种新的文本到图像模型,承诺解决这些问题,特别是与人类手部相关的。它由位于德国的 Black Forest Labs 开发。然而,与 Stability AI 的扩散模型不同,FLUX.1 是开源的,这意味着它更容易修改和微调。 它是一个使用Transformer扩散器训练的12B参数模型。FLUX.1有三个版本——Pro、Dev和Schnell。Pro版本用于商业应用,Dev用于开发和研究目的,Schnell(德语中的“快”)用于个人和商业用途。 他们声称通过一些技术优化,如流量匹配和旋转位置嵌入,实现了这种卓越的性能。我们将在另一篇文章中详细介绍技术细节。 实验与FLUX

首先,让我们尝试复制我在社交媒体上一直看到的那种图片。我尝试使用简单的提示,比如“一位女性在会议上发言的照片”和“一位女性左手拿着麦克风在会议上发言的照片”,但结果令人失望。只有在使用下面的提示时,我才能得到看起来像实际照片的东西。

提示:一位女士在会议上发言的照片。她左手拿着麦克风,右手做手势。每只手应该有五个手指。

AI生成的图像来自FLUX模型在<

https://www.basedlabs.ai/generate>这只是FLUX.1。也许下一代的模型在不单独提及的情况下,对手势的处理会做得更好。现在,让我们给DALL-E同样的提示。

AI生成的图像,由DALL-E与ChatGPT 我喜欢来自FLUX的图像,而DALL-E生成的图像看起来像是机器生成的图像。 现在,让我们尝试使用图像中的文字提示。使用FLUX.1,带有文字的那个出奇地好,它完全符合我的期望。我还注意到,关于带有文字的图像的其他一些提示也取得了积极的结果。

提示:一张门的照片,上面写着“欢迎来到我的家”。它应该是一扇木门,有一个把手。

AI生成的图像来自FLUX模型在<

https://www.basedlabs.ai/generate>尽管这次DALL·E正确理解了文本,但你可以看到“Abode”这个词的不一致之处。

由DALL-E生成的AI图像与ChatGPT 好

黑森林实验室的网站表示,他们正在研究下一代最先进的文本到视频模型。作为一个技术爱好者,我对这项技术背后的原理感到非常惊讶和兴奋。自从Stable Diffusion发布以来,我一直在学习和使用它。这些模型可以帮助无限提升人类的创造力。 我非常希望能够仅凭我的剧本就制作一部短片,而不需要接触电影公司。我想用它来生成图片,以便在我的博客文章中详细解释技术概念。这些图片可以帮助教育工作者更好地与学生沟通。还有很多其他积极的用例。 坏的

然而,我经常想知道我们是否真的需要这些生成模型,因为它们可能带来令人不安的影响。正面效应可能很容易超过负面效应。 网站上生成的提示库中有一个建议提示,是一个看似露骨的年轻女性形象。一看首页上最近生成的图片,有很多这样的图片。我不禁想知道这些公司是否在试图以不太真诚的目的迎合某些受众。 当然,还有版权问题以及使用看起来真实的图像和视频来创造和扭曲社会和政治叙事的问题。 可能的解决方案

如果公司自己提供一种不可移除的、独特的“人工智能生成”或“使用AI编辑”的水印,这对每个人都有好处。仅仅依靠用户自己负责可能在像生成性人工智能这样几乎不受监管的行业中没有太大帮助。我不认为这对能够开发出如此先进模型的科技公司来说会是一项艰巨的任务。你怎么看? 结束语

你试过Flux吗?你可以在这里尝试:https://www.basedlabs.ai 您在开始时会获得一些免费积分,之后您需要每月支付25美元。一个好处是,您还可以在“负面提示”部分中说明您不希望在图像中看到的内容。 请尝试它,并在评论区告诉我你的想法。 参考

[黑森林实验室/FLUX.1-dev · 拥抱脸]

我们正在进行一场旅程,通过开源和开放科学来推进和民主化人工智能。

Hugging Face

https://huggingface.co/black-forest-labs/FLUX.1-dev)[宣布黑森林实验室]

今天,我们非常激动地宣布推出黑森林实验室。它深深植根于生成性人工智能研究……

黑森林实验室.ai

推荐阅读:

FluxAI 中文

© 2025. All Rights Reserved