UltimatePinkPig Realistic
详情
下载文件
关于此版本
模型描述
这是用于真实风格粉红色小猪的 LoRA。
通常小巧,多为粉色,但始终是小猪。
很多人问我训练方法,以下是设置:
更新于 2023 年 5 月 15 日:将 epoch 改为 50,文件名(重复)改为 2_xxx。
1:Koyah_SS GUI
我使用 Koyha_SS GUI 来训练我的 LoRA。
一些关键设置:
"max_resolution": "768,768"
(如果你的 GPU 非常强大,使用 1024,1024 会更好)
"learning_rate": "3e-6",
"lr_scheduler": "cosine_with_restarts",
"lr_warmup": "5",
"train_batch_size": 4,
"epoch": "5",
- (2023 年 5 月 15 日:"epoch": "50",文件名为 2_xxx)
"save_every_n_epochs": "40",
"mixed_precision": "bf16",
"save_precision": "bf16",
"enable_bucket": true,
"use_8bit_adam": false,
"text_encoder_lr": "1e-5",
"unet_lr": "5e-5",
"network_dim": 128,
"clip_skip": 2,
"network_alpha": 64,
"persistent_data_loader_workers": true,
"optimizer": "Lion"
如果你的硬件不支持我的设置,可以尝试将批量大小降低到 2 或 1,这会显著增加训练时间。若希望缩短训练时间,使用 epoch 2 即可解决。
我个人使用 epoch 5,因为我的硬件支持,我认为更高的 epoch 可能能捕捉到源图中更多细节,但这并非必需。
2. 训练源图像集:
图像选择:
50 张高分辨率图像(裁剪前至少为 1024×1024),其中约 25 张为特写,20 张为上半身,5 张为全身照。图像角度越多越好。
预处理:
在 webUI 中使用自动焦点裁剪,裁剪尺寸至少为 768×768,最高可达 1536×1536。
与 BLIP 和 Deepdanbooru 集成以生成描述标签,同时使用 stable-diffusion-webui-wd14-tagger 插件生成更多标签。记得选择“在现有标签后追加”并勾选 移除重复标签。
然后我使用 BooruDatasetTagManager 手动调整标签为我想要的形式。
图像文件名:
50_xxx
(这意味着每张图像在图像文件中被重复 50 次)
- 2023 年 5 月 15 日:改为 2_xxx,但 epoch 增加至 50
此时你已经准备就绪!
不过,由于源图像的选择,你可能需要多次尝试生成的 LoRA,并多次修改源图像,直到获得满意的 LoRA。此外,每个人的硬件不同,若无法在批量大小为 4 的情况下运行 768×768,可尝试使用 2 或 1。
我认为 LoRA 的效果对源图像非常敏感,因此图像选择和标签才是最关键的部分。通过试用 LoRA,你可以判断哪些图是“差的”源图像,只需从源中删除这些“差”的图像即可改进。有时你甚至会发现 LoRA 有特定问题,提示你需要修改标签。例如,模型总是生成“湿润”效果,说明你可能未在相关源图像上标记“wet, rain, pool”。
3. 训练:
检查你通常使用的检查点是基于什么模型,然后据此选择你的基础模型。祝你训练顺利。




















