BFL推出全新Flux工具,让你轻松掌控AI图像创作!
4 个月前
经过几周对 Black Forest Labs(BFL)推出的全新 AI 图像编辑工具的测试,我可以自信地说,Flux 是目前最好的图像模型。它的图像质量和控制水平令人惊叹,甚至超越了 Midjourney 和 Google 的 Imagen 3。
如果你错过了,BFL 为 Flux 模型发布了三款 AI 图像编辑工具:
- Flux 1.0 Fill(图像修复与扩展)
- Flux 1.0 Canny and Depth(结构控制)
- Flux 1.0 Redux(图像变体与风格重塑)
这些工具都在 Flux 1.0 Dev 系列中作为开放访问模型提供。
此次发布强化了我们的双重承诺:为研究社区提供前沿的开放权重模型,同时通过我们的 API 提供一流的生成能力。 — BFL
接下来,我们详细看看这些新功能。
Flux 1.0 Fill(图像修复与扩展)
Fill 功能带来了先进的图像修复能力,表现优于 Ideogram 2.0 等工具,甚至超越了广泛使用的开源选项,如 AlimamaCreative 的 FLUX-Controlnet-Inpainting。
如果你不熟悉 AI 图像编辑中的“修复”和“扩展”术语,这里简单解释一下:
- 修复(Inpainting)是指填充图像中缺失或损坏的部分,以恢复图像或进行编辑,确保新内容与原始图像无缝融合。
- 扩展(Outpainting)则是将图像扩展到其原始边界之外,添加逼真的细节以创建更大的场景,同时保持原始艺术作品的风格和上下文。
修复功能在更改图像元素方面非常出色。看看下面的例子,图中人物的衣服可以被替换为任何其他服装。
图片来自 BFL
Flux 在渲染文本方面也非常出色,你可以擦除任何文本的一部分,并用其他内容替换它。
图片来自 BFL
扩展功能则是将图像扩展到其原始边界之外。例如,你可以让 AI 将下面左侧的输入图像扩展为一张完整的肖像图。
图片来自 BFL
结果看起来非常自然,完全看不出是扩展出来的。
Flux 1.0 Canny and Depth(结构控制)
结构控制通过在图像转换过程中保留原始结构,确保精确控制。使用 Canny 边缘检测或深度检测,它会生成边缘或深度图,以保持图像的核心构图。
简单来说,这意味着你可以在重塑或重新纹理图像的同时,确保整体设计忠于原作。看看以下示例:
图片来自 BFL
正如你在上面的示例中看到的,该功能允许用户进行文本引导的编辑,同时保持结构的完整性,特别适合用于重新纹理图像。
Flux 1.0 Canny 和 Depth 有两个版本:完整模型以实现最佳性能,以及基于 Flux 1.0 Dev 的 LoRA 版本,便于开发。
Flux Dev Depth 和 Canny 在 Flux Dev 许可下提供:
- 完整模型权重可在 Hugging Face 获取
- LoRA 权重可在 Hugging Face 获取
- 推理代码可在 GitHub 获取
Flux 1.0 Redux(图像变体与风格重塑)
这个功能的工作原理如下:给定一张输入图像,Flux 1.0 Redux 可以生成带有轻微变化的图像,从而对给定图像进行优化。
看看下面的例子,左侧的输入图像被转换为右侧的三种不同版本,同时保留了原始图像的关键元素。
图片来自 BFL
通过将图像风格整合到提示中,这一功能可以进一步扩展。看看下面这些令人惊叹的示例:
图片来自 BFL
注意输出图像如何遵循文本提示中描述的图像风格。它们看起来太棒了!
该功能在 BFL 的最新模型 Flux 1.1 Pro Ultra 中得到了支持,允许结合输入图像和文本提示,生成高质量、灵活比例的 4 百万像素输出。
在哪里尝试新的 Flux 1.0 工具?
例如,在 Replicate 中,你可以在 Flux 集合 页面访问所有工具。只需点击工具,你就可以在 playground 仪表板上试用它们。
图片来自
以下是 Flux Dev Redux 的实际操作示例:
图片来自
另一种使用新 Flux 工具的方式是通过 Flux Labs AI。在下面的截图中,我使用了“图像变体”功能,该功能由 Flux 1.0 Dev Redux 提供支持。
图片来自
你也可以在其他平台上探索其他功能。
BFL API 访问
BFL 的 API 采用异步设计,你首先发出生成请求,然后查询请求的结果。
API 参考可以访问这里。
图片来自
以下是一个使用 Flux 1.0 Fill Pro 的 NodeJS POST 请求示例,包含输入图像和掩码。
const request = require('request');
const options = {
method: 'POST',
url: 'https://api.bfl.ml/v1/flux-pro-1.0-fill',
headers: {'Content-Type': 'application/json', 'X-Key': 'YOUR_TOKEN'},
body: {
image: '',
prompt: 'ein fantastisches bild',
steps: 50,
prompt_upsampling: false,
guidance: 60,
output_format: 'jpeg',
safety_tolerance: 2
},
json: true
};
request(options, function (error, response, body) {
if (error) throw new Error(error);
console.log(body);
});
在定价方面,以下是总结:
- Flux 1.0 Fill Pro(每张图像 $0.05):使用文本提示和二进制掩码进行高级修复和扩展。
- Flux 1.0 Canny Pro(每张图像 $0.05):使用文本引导的编辑进行尖端重新纹理。
- Flux 1.0 Depth Pro(每张图像 $0.05):基于深度的条件控制,通过文本提示重新风格化图像。
图片来自
所有工具都以相同的每张图像固定价格提供最先进的功能。
商业许可
现在让我们谈谈使用 Flux 模型生成的图像的商业用途。你可以将生成的图像用于个人和商业用途吗?答案是肯定的。以下是 BFL 服务条款中的内容。
作为服务的一部分,你可以输入、发布、上传和提交文本和图像提示(“输入”)到服务中,服务将使用人工智能工具和功能生成响应,并基于你的输入生成图像和其他内容(“输出”)。我们对输出不主张任何所有权,你可以将输出用于个人或商业用途,但需遵守本文中规定的任何限制。为避免歧义,输出不包括 Flux AI 模型的任何组件,例如其权重或参数或服务的任何其他部分。
因此,这应该可以澄清你是否可以出售、复制或重新分发使用 BFL API 端点生成的任何媒体。
最后总结
我一直在等待这些图像控制功能的发布,现在终于可以访问 API 用于我自己的项目了,我感到非常兴奋。如果你是一名开发者,希望在你的应用中添加图像生成或编辑功能,Flux 无疑是目前最好的选择。它在控制和图像质量方面都优于 Midjourney,甚至超越了 Google 的 Imagen 3。
输出结果不言自明。只需浏览本文中的示例——它们都非常出色。Flux 甚至超越了它的兄弟 Stable Diffusion,尤其是在修复和扩展方面。是的,我称 Stable Diffusion 为它的兄弟,因为它们有着相同的 DNA。扩散算法的创造者也是 Flux 的背后团队。
这些新工具使编辑变得更加容易,并让你对结果有更多的控制。我强烈建议你尝试一下,看看它们如何融入你的工作流程。如果你已经尝试过,请在评论中告诉我你的想法。我很想听听你是如何使用它们的!
这个故事发表在 Generative AI 上。在 LinkedIn 上与我们联系,并关注 Zeniteq,以获取最新的 AI 故事。
油管频道,以获取生成式 AI 的最新新闻和更新。让我们一起塑造 AI 的未来!推荐阅读:
FluxAI 中文
© 2025. All Rights Reserved