FLUX BOOBA

详情

下载文件

模型描述

注意!为获得最佳效果,请阅读以下内容。

只需使用自然语言提示,例如:“一个裸体女人 blah blah blah”,因为“nude”一词出现在训练标注中,可能比“naked”效果更好。

  1. 如果使用 Fp8 dev Flux 模型,请务必使用 fp8_e4m3fn 版本以获得良好效果。

  2. 使用 LoRA 时,强度建议设置为 0.7–0.75。更高的强度会提升细节生成的准确性,但也会增加不希望出现的伪影,如杂乱的手指和其他问题。强度低于 0.7 会增强图像的整体一致性,但会降低乳头细节的清晰度,并降低下体区域(内裤可能开始显现)生成理想结果的可能性。

  3. 在 ComfyUI 中,使用 Flux 模型采样节点时,请确保将 mas_shift 设为 0.5,base_shift 也设为 0.5。

  4. 采样器请使用 Euler,调度器使用 Beta,最少采样步数为 25 步。

  5. 更高分辨率(如 1024x1400 或 1024x1216)似乎能产生最佳效果。为获得最佳结果,请使用 2:3 的长宽比(竖版)。

关于此 LoRA 的一些信息:

这是一个早期 Alpha 版本的 LoRA,尚未完全成熟,因此目前生成的生殖器或乳头细节仍不够精细,且可能存在一些局部伪影。该 LoRA 是基于 100 张女性图像及其手动标注训练的,所有图像均为“牛仔镜头”(从大腿以上拍摄),因此使用此 LoRA 生成的图像将强烈偏向此拍摄角度。虽然也能成功生成其他角度的女性图像并保持良好质量,但为避免变形和一致性问题,需降低 LoRA 强度。请根据您的使用场景调整 LoRA 强度以获得最佳效果。此为早期测试版 LoRA,请勿期待奇迹,我正在开发一个更通用的版本,将包含男性、更大规模的数据集、更多自然体型、多样化的姿势、角度和镜头,这可能需要较长时间,请耐心等待。

关于训练过程的一些基本信息:

该 LoRA 使用 A100 显卡,基于 Simple Tuner 训练脚本(向开发者致敬!)进行训练,训练基础模型为 fp16 版本的 Flux 模型。训练期间约占用 27GB 显存,A100 上的训练速度约为 2.3 秒/步。我们使用 Prodigy 优化器,常数学习率,64 维秩(rank)和 64 维 alpha,bf16 精度,gamma 值为 5。未使用 dropout,批大小为 1(批大小为 1 的效果优于其他任何批大小)。

由于裸体对 Flux 模型而言是新概念,要使模型良好收敛,每张图像至少需要 350 步,理想效果则需达到 650 步。我们经过大量测试才确定上述超参数(未来仍需进一步测试手动调参,我预计采用 AdamW 等优化器将能显著提速)。

其他值得注意的信息:我们也在 fp8 版本的 Flux 模型上进行了训练,结果与 fp16 版本相当,但收敛速度加快了一倍。这意味着在 fp8 模型上,至少需要 700 步才能较好收敛,1400 步才能获得理想效果。使用我们的设置,fp8 LoRA 训练仅需约 16.3GB 显存。因此,只要显卡拥有至少 16.3GB 显存,应均可支持训练,通过进一步优化,甚至可能在 16GB 显存的显卡上完成 fp8 LoRA 训练。

特别感谢 Raj,他提供了 A100 显卡,并成功运行了 Simple Tuner 训练脚本,还根据我们的需求对其进行了修改。

此模型生成的图像

未找到图像。