终极 FLUX LoRA 训练教程:Windows 和云部署
7 个月前
我总共进行了104次不同的LoRA训练,并对每一次进行了比较,以找到最佳的超参数和FLUX LoRA训练的工作流程,使用的是Kohya GUI训练脚本。
你可以在以下公开帖子中查看所有实验的检查点名称及其仓库链接:https://www.patreon.com/posts/110838414
在完成所有这些FLUX LoRA训练后,我使用了最优的VRAM和性能优化器Adafactor,得出了以下所有排名的可用配置。
你可以在以下链接下载所有配置、研究数据、安装程序和说明:https://www.patreon.com/posts/110879657
https://www.patreon.com/posts/110879657
教程
我还准备了两个完整的教程。第一个教程讲解如何在你的Windows电脑上本地训练和使用最佳的FLUX LoRA:https://youtu.be/nySGu12Y05k
这是你必须观看的主要教程,不能跳过,以学习所有内容。它总共有74个章节,手动编写的英文字幕。是从零到英雄的FLUX LoRA训练的完美资源。
FLUX LoRA训练简化:从零到英雄的Kohya SS GUI(8GB GPU,Windows)教程指南
我准备的第二个教程是关于如何在云上训练FLUX LoRA。这个教程非常重要,原因有几个。如果你没有强大的GPU,可以在Massed Compute和RunPod上租用非常强大且便宜的GPU。我更喜欢Massed Compute,因为它更快且更便宜,使用我们的特别优惠券SECourses。另一个原因是,在这个教程视频中,我详细展示了如何在多个GPU设置上进行训练,以加快训练速度。此外,我还展示了如何将你的检查点和文件超快上传到Hugging Face,以便免费保存和传输。仍然建议先观看上面的Windows教程,以便能够跟随下面的云教程:https://youtu.be/-uhL2nW7Ddw
超快且超便宜的FLUX LoRA训练在Massed Compute和RunPod上——无需GPU!
生成的示例图像
这些图像是在SwarmUI上使用上述共享的配置生成的,训练LoRA的数据集只有15张图像。所有内容都在教程视频中展示,供你跟随。然后我使用了SUPIR这个最佳的放大器,将它们以默认参数放大2倍,除了启用面部增强:https://youtu.be/OYxVEvDf284
在你的PC上像科幻电影一样增强和放大图像的SUPIR完整指南
用于生成以下图像的所有提示在下面的公开链接中共享:
FLUX LoRA训练简化:从零到英雄的Kohya SS GUI(8GB GPU,Windows)教程指南
在人工智能和图像生成领域的一个突破性发展中,出现了一份全面的教程,详细介绍了在FLUX上训练LoRA(低秩适应)的复杂过程,这是最新的最先进的文本到图像生成AI模型。这个教程由一位未具名的领域专家呈现,承诺将复杂的AI图像生成世界变得易于理解,使初学者和经验丰富的专业人士都能轻松掌握。
讲解者在为期一周的密集研究中,进行了72次完整的训练,以识别最有效的训练工作流程和配置。这种对全面测试和优化的投入在AI社区中树立了新的标准,因为快速的发展往往超越了全面的分析。
这个教程最显著的特点之一是其硬件要求的包容性。讲解者开发了一系列独特的训练配置,适用于VRAM仅为8GB的GPU,甚至高端型号可达48GB。这种广泛的兼容性确保了不同硬件水平的爱好者和专业人士都能参与到前沿的AI图像生成中。
该教程使用Kohya GUI,这是一个基于著名Kohya训练脚本的用户友好界面。这种软件选择使得安装、设置和开始训练变得简单,只需简单的鼠标点击。虽然演示是在本地Windows机器上进行的,但讲解者强调,云服务的过程是相同的,扩大了教程的适用性。
教程的一个关键亮点是其全面性。它涵盖了从基本概念到专家设置的所有内容,确保即使是完全的初学者也能完全训练和利用先进的FLUX LoRA模型。讲解者对细节的关注体现在手动编写的英文字幕和将教程组织成章节中,增强了可访问性和导航的便利性。
该教程不仅仅是训练,还演示了如何在Swarm UI中使用生成的LoRA,以及如何进行网格生成以识别最佳训练检查点。这种整体方法确保用户不仅学习如何训练模型,还学习如何有效实施和优化它们。
为了响应AI技术快速发展的性质,讲解者在视频结束时宣布,他们将演示如何使用最新的Kohya GUI界面训练Stable Diffusion 1.5和SDXL模型。这一补充展示了讲解者致力于提供最新和相关信息的承诺,在这个不断进步的领域中。
该教程还附带了一篇全面的书面帖子,讲解者承诺将随着研究的进展更新新信息、超参数和功能。这种持续的改进和完善的承诺证明了AI研究和开发的动态特性。
讲解者深入探讨了训练过程的技术细节,解释了各种设置的重要性,如训练轮数、重复和使用正则化图像。他们还强调了数据集质量的重要性,强调训练图像中多样的姿势、表情、服装和背景的必要性。
教程中一个最引人注目的方面是对FLUX模型灵活性的讨论。根据讲解者的说法,FLUX在生成训练数据中未明确存在的表情和情感方面表现出优越的适应性,优于SDXL或SD 1.5等模型。
该教程还提到硬件优化的重要性。讲解者建议用户如何管理VRAM使用,并提供使用nvitop等工具监控GPU利用率的技巧。这种对技术细节的关注确保用户在训练过程中最大化硬件的效率。
在强调AI开发的协作性质时,讲解者鼓励用户加入他们的Discord频道,该频道拥有超过8000名成员。这种以社区为驱动的方法促进了爱好者和专业人士之间的知识共享和问题解决。
讲解者还维护着一个GitHub仓库、一个子版块和一个LinkedIn个人资料,创建了多个参与和信息传播的渠道。这种多平台的存在反映了现代AI开发的互联特性,以及社区在推动创新中的重要性。
展望未来,讲解者暗示即将推出的教程将专注于基于云的训练解决方案,特别提到像RunPod和Massed Compute这样的平台。这种前瞻性的方法确保用户为下一波AI开发工具和平台做好准备。
总之,这个关于FLUX LoRA训练的全面教程代表了在民主化先进AI图像生成技术方面的重要一步。通过结合详细的技术指导和用户友好的方法,讲解者为任何希望探索AI技术前沿的人创造了一个有价值的资源。随着该领域以快速的速度不断发展,这样的资源将发挥关键作用,确保更广泛的社区能够跟上最新的发展,促进创新,推动AI生成图像的可能性边界。
超快且超便宜的FLUX LoRA训练在Massed Compute和RunPod上——无需GPU!
在不断发展的人工智能和图像生成领域,一个新兴的参与者承诺彻底改变我们训练和部署AI模型的方式。FLUX,一个尖端的AI系统,正在技术社区中引起轰动,因为它能够快速高效地生成高质量图像。最近的一份全面教程揭示了在云服务上训练和使用FLUX的复杂性,提供了对AI驱动图像创作未来的洞察。
该教程由一位未具名的领域专家呈现,深入探讨了使用云计算平台(如Massed Compute和RunPod)训练FLUX模型的过程。这种方法对那些可能没有强大GPU的用户或希望显著加快训练过程的用户特别有利。
FLUX在云服务上训练的一个显著特点是其成本效益。根据教程,用户可以在不到1小时的时间内以每小时仅1.25美元的价格训练“惊人的FLUX模型”,使用四个GPU。这种定价模式使高端AI训练对更广泛的用户群体可及,从个人爱好者到希望将AI生成图像纳入工作流程的小型企业。
该教程涵盖了广泛的主题,包括如何租用和利用多个GPU,如何使用图形用户界面(如Kohya GUI)进行训练,以及如何利用SwarmUI和Forge Web UI生成图像和比较模型检查点。这种全面的方法确保所有技能水平的用户都能跟随并在自己的项目中实施这些技术。
教程中强调的一个关键优势是快速高效地上传和下载检查点和训练模型的能力。讲解者演示了一种方法,可以在短短两分钟内将12GB的LoRA(低秩适应)文件上传到Hugging Face,这是一个流行的机器学习模型共享平台。这种快速的文件传输能力对需要在本地机器和云环境之间移动大型数据集和模型的用户至关重要。
该教程还强调了理解AI模型训练的基本过程的重要性。它指导观众了解设置训练环境、准备数据集和微调模型以获得最佳性能的复杂性。这种细节对那些希望深入了解AI训练方法的人来说是无价的。
有趣的是,讲解者建议在深入云方法之前观看之前的Windows基础FLUX LoRA训练教程。这一建议强调了在转向更高级的云技术之前,建立扎实的AI训练概念基础的重要性。
教程中介绍的云平台Massed Compute和RunPod各自提供独特的优势。Massed Compute因其竞争力的定价和性能而受到赞誉,教程演示了如何以每小时仅1.25美元的价格使用四个RTX A6000 GPU训练模型。RunPod虽然稍贵,每小时为四个A40 GPU收费1.4美元,但提供了永久存储的优势,这对长期项目至关重要。
FLUX在云服务上训练的一个最令人印象深刻的方面是使用多个GPU时的近线性速度提升。教程演示了如何通过同时使用四个GPU将训练时间从超过4小时减少到仅1小时。这种可扩展性对有紧迫截止日期或需要快速迭代的项目来说是一个游戏规则的改变。
该教程还涵盖了高级主题,如多GPU训练配置、多个GPU的学习率调整以及在训练过程中寻找最佳检查点的策略。这些见解对希望充分利用其基于云的训练设置的用户尤其有价值。
教程中一个有趣的比较点是Massed Compute和RunPod之间的速度差异。讲解者指出,Massed Compute上的A6000 GPU通常在训练速度和文件传输速率方面优于RunPod上的A40 GPU。然而,教程迅速指出,RunPod提供租用更强大GPU(如L40S)的选项,这可能会缩小这种性能差距。
该教程没有回避用户可能遇到的潜在问题。它逐步讲解了常见问题,如文件传输错误和配置失误,提供了明确的解决方案和变通方法。这种故障排除指导对可能对云基础AI训练不熟悉的用户来说是无价的。
FLUX训练中一个最令人兴奋的方面是能够使用SwarmUI和Forge Web UI等工具生成图像并比较模型检查点。这些界面允许用户快速迭代他们的模型并可视化结果,从而简化了微调AI图像生成的过程。
该教程还提到在进行基于云的AI训练时,进行高效文件管理和组织的重要性。它演示了如何正确构建目录、在不同云环境之间移动文件以及设置自动化脚本进行文件传输。这些最佳实践对在复杂的AI训练项目中保持顺畅的工作流程至关重要。
教程中提到的一个有趣的发展是对FLUX模型微调技术的持续研究。讲解者暗示,训练文本编码器CLIP大型模型的潜在改进可能会在FLUX的未来迭代中带来显著的质量提升。
教程以演示如何使用训练好的FLUX模型生成图像结束,包括通过SwarmUI和Forge Web UI。这种对训练模型的实际应用展示了AI图像生成的端到端过程,从初始训练到最终输出。
总之,这个关于在云服务上训练和使用FLUX的全面教程代表了在民主化访问先进AI图像生成技术方面的重要一步。通过利用云计算资源,即使是没有高端硬件的用户也可以训练出能够生成高质量图像的复杂AI模型。
这项技术的影响深远。从希望增强创作工作流程的数字艺术家到寻求为营销材料自动化图像创作的企业,FLUX和类似的AI模型有望改变多个行业。随着技术的不断发展和变得更加可及,我们可以期待在各个领域看到AI生成图像的爆炸性增长。
然而,重要的是要注意,像任何强大的技术一样,必须考虑伦理问题。生成高度逼真的图像的能力引发了关于真实性、版权和潜在滥用的问题。随着FLUX和类似技术的普及,AI社区必须制定稳健的指导方针和最佳实践,以确保负责任的使用。
展望未来,讲解者对微调技术的持续研究暗示着我们仅仅触及了AI图像生成可能性的表面。随着FLUX等模型在质量和效率上不断改进,我们可能正处于视觉内容创作的新纪元的边缘,在这个时代,人类生成和AI生成的图像之间的界限变得越来越模糊。
最终,这个教程不仅是希望利用FLUX力量的人的实用指南,也是对快速发展的AI图像生成领域的窗口。随着基于云的训练变得更加可及,FLUX等模型不断发展,我们可以期待在人工智能和人类创造力的持续故事中迎来一个激动人心的新篇章。
推荐阅读:
FluxAI 中文
© 2025. All Rights Reserved