在 WebUI Forge 上运行 Flux.1 NF4:最大化速度和性能
7 个月前
在 WebUI Forge 上运行 Flux.1 NF4:最大化速度和性能
随着 MimicPC 的最新更新,Stable Diffusion-WebUI-Forge 现在完全支持 Flux.1 模型,为用户提供了更好的 AI 驱动图像生成体验。此更新显著提升了速度和精度,特别是在使用 NF4 格式时。在这篇博客中,我们将探讨在 Stable Diffusion WebUI Forge 上运行 Flux.1 NF4 的优势,重点关注速度提升以及如何在不同的 MimicPC 硬件配置中优化性能。
NF4 与 FP8:速度和效率的比较
Flux.1 引入了两种主要的检查点格式:NF4 和 FP8。每种格式都有其独特的优势,但 NF4 在速度和效率方面表现尤为突出。
- 速度优势:NF4 的速度显著快于 FP8,尤其是在 VRAM 限制的设备上。例如,在 8GB VRAM 的设备(如 3070 Ti)上,NF4 可以将迭代时间从 8.3 秒(使用 FP8)缩短到仅 2.15 秒,提升幅度达到 3.86 倍。这使得 NF4 成为寻求快速图像生成用户的最佳选择。
- 内存效率:NF4 检查点文件的大小约为 FP8 的一半,使其在存储上更高效,加载速度更快。
- 精度和动态范围:虽然 FP8 有时可以提供更高的精度,但 NF4 在细节保留和动态范围方面通常表现更好。这得益于 NF4 复杂的张量压缩方法,优化了存储和计算。
MimicPC 硬件推荐:充分利用 NF4
MimicPC 提供了一系列硬件配置,以满足不同需求。以下是如何在每种配置上利用 NF4 的优势:
中型(T4 16GB VRAM | 16GB RAM):
- 推荐:NF4 检查点非常适合此配置。凭借 16GB 的 VRAM,您可以享受 NF4 的速度提升,同时在 WebUI Forge 中调整 GPU 权重和交换设置以获得最佳性能。
大型(A10G 24GB VRAM | 16GB RAM):
- 推荐:此配置的 24GB VRAM 使其能够轻松处理更大的模型。NF4 检查点在这里非常合适,能够加快处理速度而不牺牲图像质量。考虑增加 GPU 权重以充分利用可用的 VRAM。
大型专业(A10G 24GB VRAM | 32GB RAM):
- 推荐:由于额外的 RAM,大型专业配置非常适合更复杂的项目。使用 NF4 格式并启用异步交换方法,以在保持稳定性的同时实现更快的处理时间。
超大型(L40S 48GB VRAM | 32GB RAM):
- 推荐:超大型模型,配备 48GB VRAM,专为高性能用户设计。在这里,您可以将 NF4 推向极限,最大化 GPU 权重,并使用高级设置轻松处理多层复杂场景。
低位扩散:选择正确的设置
在 WebUI Forge 中,您可以通过“低位扩散”设置强制加载权重类型。这些选项包括 Auto
、nf4
、fp8e4
、fp4
和 fp8e5
。
然而,在大多数情况下,您可以简单地将此选项设置为 Auto
,它会根据您下载的检查点自动选择最佳精度。此功能确保您使用最有效的设置,而无需手动调整配置。
在 Stable Diffusion-WebUI-Forge 上优化 NF4
无论您使用的是哪种 MimicPC 型号,以下设置将帮助您优化 Flux.1 NF4 在 Stable Diffusion-WebUI-Forge 上的性能:
交换位置:
- CPU 交换:当 VRAM 不足时,此方法将部分模型卸载到 CPU 内存中。它可靠但速度较慢。
- 共享内存交换:对于具有充足 RAM 的 MimicPC 型号,考虑使用共享内存交换,这比 CPU 交换快多达 15%,尽管在某些系统上可能会导致不稳定。
GPU 权重滑块:根据项目需求调整 GPU 权重。较大的权重可以提高速度,但需要更多的 VRAM。对于大多数 MimicPC 配置,建议从中等设置开始,并根据性能进行调整。
交换方法:
- 队列:此方法按顺序处理层,提供稳定和可预测的性能。
- 异步:适合大型专业和超大型的 MimicPC 型号,异步可以加速处理,但需要仔细管理 GPU 内存。
精简 CFG 指导
Flux-dev 是一个精简模型。建议将 CFG 设置为 1,然后不要使用负提示。使用“精简 CFG 指导”代替。默认值为 3.5。
请注意,如果 CFG=1,负提示的 UI 将变为灰色。
使用 NF4 生成图像。
UI 选择 flux,
检查点选择:flux1-dev-bnb-nf4-v2
丛林中的宇航员,冷色调,柔和的颜色,非常详细,清晰聚焦
步骤:20,采样器:Euler,调度类型:简单,CFG 比例:1,精简 CFG 比例:3.5,种子:12345,大小:896x1152,模型:flux1-dev-bnb-nf4-v2
我们得到了一张类似的图像:
《黑神话:悟空》最近在全球引起了轰动,让我们看看 NF4 为我们带来了什么样的悟空!
中国神话,猴王悟空,戴着金箍咒,手持金箍棒,骑着筋斗云,飞翔在天宫
步骤:20,采样器:Euler,调度类型:简单,CFG 比例:1,精简 CFG 比例:3.5,种子:3107193459,大小:896x1152,模型哈希:bea01d51bd,模型:flux1-dev-bnb-nf4-v2,版本:f2.0.1v1.10.1-previous-361-g65ec461f
好吧,一个没有经历过《黑神话》的快乐猴子。
女孩,20岁,高清特写面部照片,迪士尼风格,非常详细
步骤:20,采样器:Euler,调度类型:简单,CFG 比例:1,精简 CFG 比例:3.5,种子:3107193459,大小:896x1152,模型哈希:bea01d51bd,模型:flux1-dev-bnb-nf4-v2,版本:f2.0.1v1.10.1-previous-361-g65ec461f
欧洲复古风格的客厅,黑色木家具,棕色木地板,大型落地窗,棕色皮沙发,水晶吊灯,白色雕花石膏天花板
步骤:20,采样器:Euler,调度类型:简单,CFG 比例:1,精简 CFG 比例:3.5,种子:2503002636,大小:896x1152,模型哈希:bea01d51bd,模型:flux1-dev-bnb-nf4-v2,版本:f2.0.1v1.10.1-previous-361-g65ec461f
结论
随着 MimicPC 对 Stable Diffusion-WebUI-Forge 的最新更新,使用 Flux.1 模型——尤其是 NF4 格式——从未如此强大。通过将您的硬件设置与正确的配置对齐,您可以充分利用 NF4 的速度和效率,使您的图像生成工作流程更快、更有效。无论您使用的是中型配置还是超大型模型,这份指南都将帮助您优化 Flux.1 NF4 的使用,推动您的创作极限。
今天就与 MimicPC 一起探索这些更新,体验 AI 驱动创意的下一个层次。
FluxAI 中文
© 2025. All Rights Reserved