我推出了我的第一个 AI 产品——Flux Labs
7 个月前
致我所有的 Medium 关注者和 Substack 订阅者,我非常自豪地宣布,我的第一个人工智能软件即服务(SaaS)产品,Flux Labs,现已正式上线!
经过几周的规划、编码和产品优化,Flux Labs 现在向全世界开放。我们的主要目标是成为使用 Flux 模型 进行 AI 图像和视频生成的领先平台,这些模型来自 Black Forest Labs。
很多人会问:为什么又要推出一个图像生成器?
我知道…我知道。市面上已经有很多 AI 图像生成器了。市场上充斥着各种工具,从小型初创公司到大品牌。但 Flux Labs 的独特之处在于它使用了 Flux 图像模型。
如果你还不知道,这些拥有 120 亿参数的模型是最先进的(SOTA)且是开放权重的。这意味着你可以下载它们,在本地机器上运行,并生成图像 而无需互联网连接。
这里有一个有趣的事实: Black Forest Labs 的团队由稳定扩散技术的原始开发者和 潜在扩散 的发明者组成。在 Stability AI 遇到一些 内部问题 后,关键团队成员离开并成立了新的初创公司。
当我第一次测试 Flux 时,我完全 震惊。图像质量、对提示的遵循程度以及文本渲染的准确性都令人惊叹。我使用过 MidJourney 和许多其他工具,但 Flux 超越了它们。
此外,开发者们计划很快推出视频模型。我的目标是让用户用他们的自定义产品图像训练模型,并将其转化为视频广告。潜在的应用是无限的,我很高兴在这个时刻推出 Flux Labs,以便走在潮流前沿。
Flux Labs 技术栈
对于在场的开发者们,我知道你们对底层技术感到好奇,所以这里是我使用的完整技术栈:
- Next.js 14 框架,TypeScript
- NextAuth 用于身份验证
- Tailwind CSS、Framer Motion 和 React 用于前端
- Vercel Postgres 和 Prisma 用于数据库管理
- AWS S3 用于图像存储
- Stripe 用于处理订阅和支付
- Sanity 用于博客管理
- Vercel 用于托管和部署
我通过 GoDaddy 购买了域名,并使用 Google Search Console(GSC)和 Google Analytics 进行 SEO 跟踪和用户洞察。
Flux Labs 功能
在上线时,Flux Labs 将提供三项强大的功能:
- 使用 Flux 模型生成图像:测试三种模型——Schnell、Dev 和 Pro,它们在速度和质量方面各有不同。
- 图像模型训练:你可以用自己的照片微调 Flux 模型,创建无限个性化的图像——无论是为自己、宠物还是产品。
- 图像放大器:此功能将允许用户将图像放大并增强至原始大小的 4 倍。这不仅仅是简单的分辨率提升;背后有复杂的 AI 在智能地添加细节和清晰度。
这些功能可以通过 AI 工具 下拉菜单访问。
图像由 Jim Clyde Monge 提供
让我们深入了解它们的工作原理。
如何生成图像
登录你的 Google 账户后,导航到 AI 工具菜单下的 图像生成器。
图像生成器仪表板简单直观。你只需在提示字段中描述你想要的内容,调整参数,然后观看魔法发生。
一些可调参数包括:
- Flux 模型: Flux Schnell 是最快的,结果质量良好;Flux Dev 较慢但生成更好的图像;Flux Pro 是最佳模型,但生成结果所需时间最长。
- 纵横比: 调整图像的分辨率为正方形(1:1)、肖像(4:5)、风景(16:9)等。
- 步骤: 这是一个整数,定义图像生成过程中的步骤数。更多步骤通常会导致更高质量的图像,但也会增加计算时间。
- 引导: 也称为无分类器引导(CFG)比例,是一个控制 AI 图像生成过程如何紧密遵循文本提示的参数。
- 种子: 这个数字是为每个图像随机生成的,但可以通过种子参数指定。如果你使用相同的种子数字和提示,你将获得相似的最终图像。
- 输出格式: 你可以选择输出图像的文件格式,包括 JPG、PNG 和 Webp。
- 输出质量: 在 0 到 100 之间调整图像质量。数字越高,处理时间越长。
图像由 Jim Clyde Monge 提供
如果你对设置不确定,默认设置就很好。这里有一个示例:
提示:一只可爱的狗躺在一个蓬松的圆形枕头上,微笑着拍照
太棒了!即使在 Flux Pro 设置下,生成速度也很快,结果看起来绝对令人印象深刻。以下是结果的扩展版本:
图像由 Jim Clyde Monge 提供
你还可以在创作页面查看图像。
如何训练图像模型
要训练自定义模型,请从主页或 AI 工具菜单中点击 训练模型。
图像由 Jim Clyde Monge 提供
在训练页面上,你需要填写表单,包括你的 模型名称、触发词,并上传 4 张以上的图像。
什么是触发词?
触发词 是指你正在训练的对象、风格或概念。选择一个不是实际单词的字符串,比如 TOK,或者与正在训练的内容相关的词,比如 CYBRPNK。你指定的触发词将在训练期间与所有图像相关联。然后,当你运行微调后的模型时,可以在提示中包含触发词以激活你的概念。
注意: 上传 4-10 张高质量样本,正面朝向,正方形纵横比,1 人在框架内,多个角度。
我不会在这篇文章中逐步讲解。如果你想要详细的指南,可以查看我关于 如何训练 Flux AI 模型 的文章,里面有逐步的分解。
如何训练 Flux AI 图像模型以生成无限的你自己的照片
训练完成后,你将看到一个“使用模型”按钮,可以开始创建自定义图像。
图像由 Jim Clyde Monge 提供
微调模型的图像生成页面与之前的图像生成页面大致相同。
图像由 Jim Clyde Monge 提供
在提示字段中,确保在提示中添加触发词。
以下是一个示例:
提示:jimclyde 穿着礼服,背景为红色
当我看到结果时,我忍不住大笑。这就像在镜子里看自己——AI 的我穿着各种礼服风格!
图像放大器功能(即将推出)
我仍在开发此功能,但计划使用 Clarity Upscaler。这是迄今为止通过 API 访问的最佳放大器模型。
请查看下面的前后对比示例:
我得到的结果与 Magnific AI 非常接近。
费用是多少?
Flux Labs 为其 AI 图像生成和图像模型训练平台提供分层订阅模型,分为三种选项:Pro、Premium 和 Enterprise。
图像由 Jim Clyde Monge 提供
Pro 级别每月费用为 9.99 美元
- 200 张 Flux Schnell 图像
- 100 张 Flux Dev 图像
- 66 张 Flux Pro 图像
- 1 个自定义模型
Premium 级别每月费用为 19.99 美元
- 500 张 Flux Schnell 图像
- 250 张 Flux Dev 图像
- 125 张 Flux Pro 图像
- 3 个自定义模型
Enterprise 级别每月费用为 49.99 美元
- 1,500 张 Flux Schnell 图像
- 750 张 Flux Dev 图像
- 375 张 Flux Pro 图像
- 5 个自定义模型
接下来是什么?
Flux Labs 还有很多新功能在开发中。我目前正在开发的一些功能包括:
- Flux LoRA 模型,用于更精细的生成。
- 文本到视频和 图像到视频 功能。
- 根据你已经创建的图像生成 视频 的能力。
- 一个 社区页面,用于分享提示、微调模型等。
我还计划在年底之前推出这些改进:
- 一个 联盟计划。
- 更多 定价选项,如一次性购买或年度订阅。
- 提升 用户界面 和 用户体验。
- 一个 营销策略,以提高社交媒体的可见性并改善 SEO。
- 网站优化,如升级存储、托管和更多 AI 集成。
最后想法
这是我第一次完全独立构建和推出的产品,我感到无比自豪。当然,难免会有一些小故障和错误,但我渴望在它们出现时及时解决。
我对 Flux Labs AI 的愿景是创建一个生成自定义图像和微调模型的首选平台。我也热衷于帮助企业和个人快速生成高质量、个性化的图像,以用于品牌推广。
请访问 Flux Labs AI 网站,试用一下,并告诉我你的想法。如果你能订阅一个计划并探索微调功能,我将不胜荣幸!
推荐阅读:
FluxAI 中文
© 2025. All Rights Reserved