FLUX.1 生成图像


7 个月前

FLUX.1 特点

1. 速度与效率

FLUX.1 被设计为快速生成图像,其速度优于 StableDiffusion、Midjourney、Colors 和 Aura 等竞争对手。该模型提供三种版本:

  • FLUX.1[Schnell]:Flux Schnell 生成的图像质量较低,但速度比 Pro 模型快约 10 倍。
  • FLUX.1[Dev]:Flux Dev 针对开发者进行了定制,支持图像间生成等高级功能。
  • FLUX.1[Pro]:支持 120 亿个参数的最强版本 Flux Pro 是私有源代码,通过 API 提供使用。

2. 提示遵循与质量

Flux.1 的一大亮点是其出色的提示遵循能力。无论是简单提示还是复杂提示,该模型都能一致地提供与输入描述几乎完全匹配的高质量图像。例如,像“看着相机的猫,鱼眼镜头”这样的简单提示会生成与 Midjourney V6 相似的结果。更复杂的提示则能惊人地准确指示场景中物体的布局和细节。

FLUX.1 使用方法

1. FLUX1 AI 官方网站

在 FLUX1 AI 官方网站上,用户可以免费使用 Schnell,但速度较慢。使用 Dev 和 Pro 版本需要订阅月费。

网站链接: https://flux1ai.com/

2. Replicate

Replicate 是一个用户友好的平台,允许用户在云端运行机器学习模型。Flux Point1 可以在 Replicate 上免费访问和测试。

网站链接: https://replicate.com/black-forest-labs/flux-dev

3. Poe

https://poe.com/ 上选择 FLUX 模型进行使用。

4. Seaart.ai

Seaart.ai 是一个 AI 平台,提供包括最近新增的 FLUX.1 模型在内的多种扩散模型的图像生成工具。用户可以通过该平台轻松免费生成高质量图像。Seaart.ai 每天提供约 150 个积分,每次图像生成任务根据屏幕比例消耗约 1 个积分。图像对图像的任务可能需要稍多的积分。

网站链接: https://www.seaart.ai/

5. Fal.ai

Fal.ai 是另一个可以访问 FLUX.1 的平台。该平台的流程与其他平台类似,用户可以通过文本提示轻松生成图像。

网站链接: https://fal.ai/models/fal-ai/flux/dev/playground

6. Toast AI

Toast AI 是一个免费开源平台,托管包括 FLUX.1 在内的最新 AI 论文和模型。FLUX.1 开发模型可用于生成包括动画在内的多种风格的图像。

网站链接: https://tost.ai/

7. API 访问

如需用于高级或商业目的,可以通过 Black Forest Labs 提供的 API 直接访问 FLUX.1[pro]。在 https://flux-ai.io 注册后,发放 API 密钥即可付费使用。

8. Hugging Face

Hugging Face 提供基于 FLUX.1 的 Schnel 模型的试用版。该平台提供了一个方便的方式来测试可调设置的模型。

网站链接: https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

使用 Hugging Face Pipeline

依赖项

!pip install transformers diffusers sentencepiece accelerate protobuf

import torch
from diffusers import FluxPipeline
import diffusers
from PIL import Image
import matplotlib.pyplot as plt

安装的 bitsandbytes 版本未编译 GPU 支持。8 位优化器、8 位乘法和 GPU 量化不可用。

Flux Rope

# 修改 Rope 函数以处理 CUDA
_flux_rope = diffusers.models.transformers.transformer_flux.rope

def new_flux_rope(pos: torch.Tensor, dim: int, theta: int) -> torch.Tensor:
    assert dim % 2 == 0, "维度必须是偶数。"
    if pos.device.type == "cuda":
        return _flux_rope(pos.to("cpu"), dim, theta).to(device=pos.device)
    else:
        return _flux_rope(pos, dim, theta)
diffusers.models.transformers.transformer_flux.rope = new_flux_rope

Pipeline

pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.1-schnell",
    revision='refs/pr/1',
    torch_dtype=torch.bfloat16
).to('cuda')

正在加载管道组件...: 0%| | 7/7 [00:00<?, ?it/s] 正在加载检查点分片: 0%| | 2/2 [00:00<?, ?it/s]

提示

prompt = "一位现代、极简风格的韩国女孩,穿着朋克和哥特风格的服装。"

生成图像

# 生成图像
out = pipe(
    prompt=prompt,
    guidance_scale=0.,
    height=1024,
    width=1024,
    num_inference_steps=4,
    max_sequence_length=256,
).images[0]

保存与展示

# 保存生成的图像
out.save("gen_girl.png")

# 展示生成的图像
image = Image.open("gen_girl.png")
plt.imshow(image)
plt.axis('off')
plt.show()

FLUX.1 提示结构与组件技巧

在提示中反映以下元素,可以生成更细致和具体的图像。

  • 主题:图像的主要焦点。
  • 风格:艺术表现或视觉美学。
  • 构图:元素在画面中的排列方式。
  • 光线:场景中的光线类型和质量。
  • 色彩调色板:主导颜色或配色方案。
  • 情绪/氛围:图像的情感基调或氛围。
  • 技术细节:相机设置、视角或特定视觉技术。
  • 附加元素:支持细节或背景信息。

推荐阅读:

FluxAI 中文

© 2025. All Rights Reserved