FLUX.1:人工智能图像生成的未来,现在对所有人开放


8 个月前

FLUX.1:AI图像生成的未来,现在对所有人开放

黑森林实验室推出了FLUX.1,这是一种先进的AI图像生成扩散模型,提供卓越的速度、质量和即时遵循性。FLUX.1有三种版本——Schnell、Dev和Pro——利用创新技术如Rectified Flow Transformers生成高度逼真的图像。FLUX.1可以生成文本并处理细节,如手指和脚趾——一个优秀的图像生成器所需的一切。此外,其开源特性促进了社区参与和创新。本文探讨了各种在线免费访问FLUX.1并在Google Colab上运行它的方法。FLUX.1的推出挑战了像MidJourney这样的老牌玩家,并在AI图像生成领域树立了新的标准,有望对创意和数字内容产业产生重大影响。

(<

https://blackforestlabs.ai/>)FLUX.1的主要特点

  1. 速度和效率

FLUX.1 旨在快速生成图像,超越了像 Midjourney、Colors 和 Aura 这样的竞争对手。该模型有三个版本: * FLUX.1[Schnell]: Flux Schnell 生成图像的速度大约是 Pro 型号的 10 倍,尽管质量较低。 * FLUX.1[开发]: Flux Dev 是为开发者量身定制的,支持高级功能,如图像到图像的生成。 * FLUX.1[优点]: Flux Pro,拥有120亿参数的最强大的变体,是闭源的,并且可以通过API使用。 2. 提示的遵循性和质量

Flux.1的一个显著特点是其出色的提示遵循能力。无论是使用简单还是复杂的提示,该模型始终能够提供与输入描述非常接近的高质量图像。例如,一个简单的提示如“一只猫看着相机,鱼眼镜头视角”产生的结果与Midjourney V6相当。更复杂的提示可以以惊人的准确性指导场景中物体的放置和细节。

由FLUX.1 Shenell模型生成的图像,描述为“一只猫看着相机,鱼眼镜头视角” 性能和能力

在基准测试中,FLUX.1在与竞争对手相比的各种指标上表现出了卓越的性能。它在视觉质量、及时遵守和输出多样性方面表现出色,支持从0.1到2.0百万像素的多种纵横比和分辨率。这种灵活性使其适用于从艺术创作到商业项目的各种应用。

FLUX.1 的架构集成了先进的技术,如 Rectified Flow Transformers、并行注意力层和旋转位置嵌入,这些技术共同为其高效率和卓越的输出质量做出了贡献。这种模型架构使 Flux 能够生成不仅逼真而且高度详细和解剖学上准确的图像。 实际例子

为了展示FLUX.1的功能,请考虑以下示例: 1. 简单提示:

  • 输入: “一个侧面写着FLUX.1的咖啡杯
  • 输出:一张高质量的咖啡杯图片,上面清晰可见“FLUX.1”的文字,展示了FLUX.1生成文本的能力。

  1. 复杂提示:

  2. 输入: “一个夜晚的未来城市景观,有霓虹灯照亮的摩天大楼、飞行汽车和全息广告牌宣传星际旅行。在前景中,一群穿着未来服装的人沿着一座透明的行人天桥行走。

  3. 输出: 一个复杂图像,准确反映详细的提示。

通过在线平台访问Flux Point1

FLUX.1的一个显著特点是其开源特性,特别是Dev和Schnell版本,这些版本可以在Hugging Face等平台上下载。这种开放性促进了社区的参与和创新,为AI图像生成领域的进一步发展提供了坚实的基础。 FLUX.1 图像生成器真的很棒。我强烈推荐这个产品:

https://flux-ai.io

提供文本到图像生成器和Flux AI图像提示。只需点击免费试用:

https://flux-ai.io

此外,许多平台已经集成了FLUX模型或提供FLUX.1图像生成服务。以下是其中的一些: 1. 复制

Replicate 是一个用户友好的平台,允许用户在云端运行机器学习模型。Flux Point1 可以在 Replicate 上免费访问和测试。 * 网站

https://replicate.com/black-forest-labs/flux-dev

  • 输入:具有可自定义设置的文本提示,例如长宽比、图像数量、种子等。
  • 输出质量:可调节至100以获得最佳结果。
  • 过程:输入文本提示,自定义设置,点击‘运行’,然后等待生成的图像。

2. 坡

  • 访问Poe网站(<

https://poe.com/>)并选择FLUX模型:

  1. Seaart.ai

Searart.ai 是一个由各种扩散模型驱动的人工智能平台,包括最近添加的 FLUX.1 模型。该平台允许用户轻松且免费生成高质量的图像。Searart.ai 每天提供大约 150 个积分,每个图像生成任务大约消耗一个积分,具体取决于纵横比。图像到图像的任务可能需要稍微更多的积分。 * 网站: <

https://www.seaart.ai/>* 选择Swift AI选项,然后点击“Flux 文本到图像”。 * 请输入您的文本提示,选择所需的纵横比,选择一个随机或自定义种子,并启动生成过程。

  • Seaart.ai 还支持使用 FLUX 的图像到图像生成。1. 选择 AI 选项,然后点击“Flux 图像到图像”。 4. 拥抱脸

Hugging Face 提供了基于 FLUX.1 的 Schnell 模型的试用版本。该平台提供了一种方便的方式来测试模型,并可调整设置。 * 网站

https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

  • 输入:带有可选高级设置的文本提示,用于自定义。
  • 流程:输入文本提示,如有需要可展开高级设置,点击“运行”以生成图像。
  • Fal.ai

Fal.ai 是另一个可以访问 FLUX.1 的平台。该过程与其他平台类似,使得使用文本提示生成图像变得容易。 * 网站

https://fal.ai/models/fal-ai/flux/dev/playground

  • 输入:带有基本设置的文本提示。
  • 过程:输入文本提示,点击“运行”以创建图像。
  • 显著表现:FLUX.1在处理复杂主题,如手部方面,表现出令人印象深刻的处理能力。
  • Toast AI

Toast AI 是一个免费且开源的平台,它托管了最新的人工智能论文和模型,包括 FLUX.1。FLUx.1 开发模型可以用来生成各种风格的形象,包括动漫。 * 网站: <

https://tost.ai/> 输入:带有模型选择的文本提示。 * 流程:选择FLUX.1开发模型,输入文本提示,并继续生成图像。 * 性能*:在生成动漫风格的图像方面表现出色。 7. API访问

对于更高级或商业用途,您可以直接通过Black Forest Labs提供的API访问FLUX.1 [pro]。 在Google Colab上运行Flux模型

正如前面提到的,FLUX.1是开源的,这使得用户可以访问并进一步开发。让我们演示如何在Google Colab上访问模型并运行它: 1. 前往

Google Colab

. 2. 创建一个新的笔记本:点击“文件” -> “新建笔记本”。 3. 将运行时更改为A100 GPU:FLUX.1需要32GB的GPU RAM才能运行,因此请确保您选择了A100 GPU运行时。 4. 复制并粘贴代码**:复制提供的代码并将其粘贴到笔记本中的一个单元格中。 ```

install the packages

!pip install git+https://github.com/huggingface/diffusers.git !pip install transformers sentencepiece accelerate protobuf ```

``` import torch from diffusers import FluxPipeline import diffusers from PIL import Image import matplotlib.pyplot as plt

Modify the rope function to handle CUDA device

_flux_rope = diffusers.models.transformers.transformer_flux.rope def new_flux_rope(pos: torch.Tensor, dim: int, theta: int) -> torch.Tensor: assert dim % 2 == 0, "The dimension must be even." if pos.device.type == "cuda": # Move tensor to CPU for ROPE computation, then move it back to CUDA return _flux_rope(pos.to("cpu"), dim, theta).to(device=pos.device) else: # Perform ROPE computation directly if tensor is not on CUDA return _flux_rope(pos, dim, theta) diffusers.models.transformers.transformer_flux.rope = new_flux_rope

Load the Flux Schnell model

pipe = FluxPipeline.from_pretrained( "black-forest-labs/FLUX.1-schnell", revision='refs/pr/1', torch_dtype=torch.bfloat16 ).to("cuda")

Define the prompt

This is the textual description that the model will use to generate the image

prompt = "A modern, minimalist house with large windows and a flat roof."

Generate the image

out = pipe( prompt=prompt, guidance_scale=0., height=1024, width=1024, num_inference_steps=4, max_sequence_length=256, ).images[0]

Save the generated image

out.save("gen_image.png")

Display the generated image

image = Image.open("gen_image.png") plt.imshow(image) plt.axis('off') # Hide axes plt.show() ```

  • 运行单元格:点击播放按钮或按 Shift + Enter 来运行单元格。

对未来的影响和结论

黑森林实验室推出的FLUX.1标志着AI驱动图像生成领域的一个重要里程碑,提供了一个强大且易于使用的模型,挑战了像MidJourney这样的老牌玩家。通过结合高性能、易用性和社区驱动的开发,FLUX.1将对创作者和专业人士的AI工具格局产生重大影响。 随着多个平台提供免费访问,用户无需高级硬件或复杂设置即可生成高质量的图像。随着更多平台采用Flux Point1,它对AI艺术社区的影响将会增长。此外,Black Forest Labs计划开发文本到视频的模型,这可能会彻底改变创意和数字内容产业。 总之,FLUX.1在人工智能图像生成方面树立了新的标准,挑战了既定的玩家。它的易用性和开源优势使其成为一个强大的工具。随着未来文本到视频模型的计划,Black Forest Labs准备改变创意和数字内容产业,使人工智能驱动的内容创作前景更加光明。

推荐阅读:

FluxAI 中文

© 2025. All Rights Reserved