FLUX BOOBA
详情
下载文件
模型描述
注意!为获得最佳效果,请阅读以下内容。
只需使用自然语言提示,例如:“一个裸体女人 blah blah blah”,因为“nude”一词出现在训练标注中,可能比“naked”效果更好。
如果使用 Fp8 dev Flux 模型,请务必使用 fp8_e4m3fn 版本以获得良好效果。
使用 LoRA 时,强度建议设置为 0.7–0.75。更高的强度会提升细节生成的准确性,但也会增加不希望出现的伪影,如杂乱的手指和其他问题。强度低于 0.7 会增强图像的整体一致性,但会降低乳头细节的清晰度,并降低下体区域(内裤可能开始显现)生成理想结果的可能性。
在 ComfyUI 中,使用 Flux 模型采样节点时,请确保将 mas_shift 设为 0.5,base_shift 也设为 0.5。
采样器请使用 Euler,调度器使用 Beta,最少采样步数为 25 步。
更高分辨率(如 1024x1400 或 1024x1216)似乎能产生最佳效果。为获得最佳结果,请使用 2:3 的长宽比(竖版)。
关于此 LoRA 的一些信息:
这是一个早期 Alpha 版本的 LoRA,尚未完全成熟,因此目前生成的生殖器或乳头细节仍不够精细,且可能存在一些局部伪影。该 LoRA 是基于 100 张女性图像及其手动标注训练的,所有图像均为“牛仔镜头”(从大腿以上拍摄),因此使用此 LoRA 生成的图像将强烈偏向此拍摄角度。虽然也能成功生成其他角度的女性图像并保持良好质量,但为避免变形和一致性问题,需降低 LoRA 强度。请根据您的使用场景调整 LoRA 强度以获得最佳效果。此为早期测试版 LoRA,请勿期待奇迹,我正在开发一个更通用的版本,将包含男性、更大规模的数据集、更多自然体型、多样化的姿势、角度和镜头,这可能需要较长时间,请耐心等待。
关于训练过程的一些基本信息:
该 LoRA 使用 A100 显卡,基于 Simple Tuner 训练脚本(向开发者致敬!)进行训练,训练基础模型为 fp16 版本的 Flux 模型。训练期间约占用 27GB 显存,A100 上的训练速度约为 2.3 秒/步。我们使用 Prodigy 优化器,常数学习率,64 维秩(rank)和 64 维 alpha,bf16 精度,gamma 值为 5。未使用 dropout,批大小为 1(批大小为 1 的效果优于其他任何批大小)。
由于裸体对 Flux 模型而言是新概念,要使模型良好收敛,每张图像至少需要 350 步,理想效果则需达到 650 步。我们经过大量测试才确定上述超参数(未来仍需进一步测试手动调参,我预计采用 AdamW 等优化器将能显著提速)。
其他值得注意的信息:我们也在 fp8 版本的 Flux 模型上进行了训练,结果与 fp16 版本相当,但收敛速度加快了一倍。这意味着在 fp8 模型上,至少需要 700 步才能较好收敛,1400 步才能获得理想效果。使用我们的设置,fp8 LoRA 训练仅需约 16.3GB 显存。因此,只要显卡拥有至少 16.3GB 显存,应均可支持训练,通过进一步优化,甚至可能在 16GB 显存的显卡上完成 fp8 LoRA 训练。
特别感谢 Raj,他提供了 A100 显卡,并成功运行了 Simple Tuner 训练脚本,还根据我们的需求对其进行了修改。










