黑森林实验室推出Flux Pro微调API!你准备好尝试了吗?
2 个月前
黑森林实验室推出 Flux Pro 微调 API
图片来自 Jim Clyde Monge
在黑森林实验室(BFL)发布 Flux 开发者微调功能时,AI 社区为之疯狂,因为任何人都可以通过展示少量示例图像来教会模型识别和生成新概念,从而可以为特定风格、角色或物体定制模型的输出。
它迅速成为市场上最优秀的图像模型微调解决方案之一。如果你想了解如何微调 Flux Dev 模型,请查看这份指南:
如何训练 Flux AI 图像模型生成无限数量的自己的照片
今天,BFL 进一步迈出了新的一步,允许用户通过 API 来微调 Flux Pro 模型。
根据 BFL 的说法,用户只需提供 1 到 5 张示例图像,即可通过文字提示轻松重塑用户提供的内容。这些图像可以采用不同的格式,例如 JPG、JPEG、PNG 或 WebP,分辨率限制在一百万像素,以获得最佳效果。
以下是一些示例输入图像:
黑森林实验室提供的图像
训练的持续时间取决于使用的图像数量和用户设置的迭代次数。以下是一些示例结果:
黑森林实验室提供的图像
此外,Flux Pro 微调模型支持对给定图像的逐步编辑。该技术结合了输入图像中的主题,以增强结果。
黑森林实验室提供的图像
以下是 BFL 的所有 Flux 模型的定价细节:
- Flux 1.1 Pro Ultra: 每张 $0.06
- Flux 1.1 Pro: 每张 $0.04
- Flux 1.0 Pro: 每张 $0.05
- Flux 1.0 Dev: 每张 $0.025
如何尝试 Flux Pro 微调
尝试 Flux Pro 微调 的最简单直接的方法是在 Fal AI 上。请在探索页面中查找 fal-ai/flux-pro-trainer
模型,你应该会看到如下屏幕。
图片来自 Jim Clyde Monge
在 数据 URL 中,上传你的输入图像集合,或上传一个包含图像的压缩文件。可选地,修改微调评论和触发词。
将你的肖像图像添加为训练输入。保持其他设置为默认,并点击 开始 按钮。
图片来自 Jim Clyde Monge
注意,触发词已更改为 Jimportrait
,训练步骤设置为 300。你可以将此值提高到 1000,以获得最佳结果,但这也会耗费更多时间且成本更高。
当训练完成后,你会在屏幕右侧看到“完成”状态和一个微调 ID。
图片来自 Jim Clyde Monge
要从训练过的模型生成图像,点击 运行推断 按钮。使用如下示例提示:
提示: Jimportrait 在现代办公室环境中。他穿着合身的深色西装和挺括的白衬衫,面带自信且平易近人的表情。办公室的设计时尚简约,宽大的窗户让自然光透入,桌上有一台笔记本电脑,背景有几个书架。
图片来自 Jim Clyde Monge
我不知道自己哪里做错了,因为结果与我的预期并不相近。我试过调整参数和设置,但仍然无法正常工作。
关于成本,请查看以下细节:
- 150 次以内的请求费用为 $2。
- 150 到 500 次的请求费用为 $4。
- 超过 500 次的请求费用为 $6。
你还可以通过 Fal 的 API 访问微调模型。只需打开 API 选项卡,按照说明将 API 集成到你自己的应用程序中。
图片来自 Jim Clyde Monge
以下是一个示例的 NPM 调用:
import { fal } from "@fal-ai/client";
const result = await fal.subscribe("fal-ai/flux-pro-trainer", {
input: {
data_url: "",
finetune_comment: "test-1"
},
logs: true,
onQueueUpdate: (update) => {
if (update.status === "IN_PROGRESS") {
update.logs.map((log) => log.message).forEach(console.log);
}
},
});
console.log(result.data);
console.log(result.requestId);
注意: Fal 生成的图像没有商业限制,因此你可以将结果用于商业目的。
如何尝试 Flux Pro 微调 API
好的,现在如果你对直接使用黑森林实验室的 API 感兴趣,请按照以下步骤操作。
首先,要开始,添加一个 API 密钥,以便在尝试访问图像模型时获得授权。
图片来自 Jim Clyde Monge
微调 API 的参考可以在此 互动文档 中找到。
图片来自 Jim Clyde Monge
以下是一个示例的 POST 请求。确保使用你自己的 API 密钥替换 YOUR_SECRET_TOKEN 参数。
fetch('https://api.us1.bfl.ai/v1/finetune', {
method: 'POST',
headers: {
'Content-Type': 'application/json',
'X-Key': 'YOUR_SECRET_TOKEN'
}
})
请注意 POST 请求的主体部分的参数。
{
"file_data": "",
"finetune_comment": "my-first-finetune",
"trigger_word": "TOK",
"mode": "general",
"iterations": 300,
"learning_rate": 1,
"captioning": true,
"priority": "quality",
"finetune_type": "full",
"lora_rank": 32
}
定价讨论
黑森林实验室简化了定价,这样你就可以专注于你的项目。
以下是定价细节:
- 150 次以内: 对于快速测试或小规模实验,费用为 $2。
- 150 到 500 次: 对于大多数项目,费用为 $4,在确保质量的前提下不会过于昂贵。
- 超过 500 次: 对于需要更高精度和细节的复杂任务,费用为 $6。
图片来自黑森林实验室
生成图像时也需要单独支付费用。
虽然较早的 Flux Dev 模型允许以较低价格进行微调和图像生成,但 Flux Pro 的成本上涨反映了其增强的能力。然而,这可能使得预算紧张的用户和习惯于使用 Flux Dev 便宜的用户觉得使用门槛提高了。
尽管如此,对于重视高质量输出和先进微调功能实用性的用户来说,Flux Pro 可能还是值得这个额外的费用。这是成本与能力之间的权衡。
优势与劣势
BFL 进行了一项用户研究,发现 68.9% 的受访者更喜欢 Flux Pro 微调的结果,而不是其他现有的微调服务。
黑森林实验室对不同的使用案例提供了具体建议。对于角色模型训练,他们建议使用单个角色的图像。在风格转换任务中,增加微调强度通常会产生更好的结果。
然而,对于那些尚未了解的人来说,Flux Pro 不是开放权重的。这意味着你不能从互联网下载模型并在本地计算机上运行。它们只允许你通过 API 为 Flux Pro 训练 lora。
这意味着什么?
这意味着你需要为每次培训支付费用,通过 BFL 的 API。
这意味着你需要为从微调模型生成的每张图像支付费用。
最后思考
作为一名使用 AI 构建网络应用程序的开发者,这对我来说是一个重大消息。我在四个月前推出了 Flux Labs AI,允许用户使用 Flux 图像模型创建自定义 LoRA。虽然这一直很好,但有些用户指出生成的图像并不总是与输入示例相匹配。
我希望升级到 Flux Pro 微调能在解决这个问题和提高微调图像质量方面产生重大影响。只需要 1-5 张图像进行微调的想法听起来像是一个改变游戏规则的因素。
不利的一面是,现在微调的成本更高,且由于 Flux Pro 不是开放权重的,我们只能依靠 BFL 的 API 进行训练和生成图像。这意味着可用的自定义 LoRA 可能会减少,这让人失望。
尽管如此,这是一个令人兴奋的更新。我非常希望能看到 API 访问扩展到像 Fal AI 和 Replicate 这样的平台,因为它们对于开发者来说极其简单易用。希望这只是更多改进的开始。
本文发布于 Generative AI。与我们在 LinkedIn 上联系并关注 Zeniteq,以获取最新的 AI 资讯。
油管 频道,保持跟进生成式 AI 的最新新闻和更新。让我们共同塑造 AI 的未来!推荐阅读:
FluxAI 中文
© 2025. All Rights Reserved