Fursuit Head LoRA for PonyXL
详情
下载文件
关于此版本
模型描述
PonyXL 模型的 Fursuit 头部 LoRA
PonyXL 能理解“fursuit”的概念,但无法理解“部分 fursuit”或“fursuit 头部”的概念,即便如此,生成质量也往往参差不齐。
该 LoRA 使用 OneTrainer 和 Prodigy 算法,在 76 张高质量图像上训练了 10 个周期、每个周期重复 2 次。这些图像展示了不同姿势下穿着多种物种 fursuit 头部的人。训练过程中使用了掩码训练和强烈的图像提示,以专注于 fursuit 头部本身的概念。
训练基于一个 Everclear 和 Pony Realism 的自定义模型合并体。
数据集由 50% 真实照片和 50% 插画组成,其中 SFW 与 NSFW 的比例为 25:75。尝试了 50% 男性和 50% 女性比例,但数据集主要由男性构成。
推荐设置:
关键词:
furryzsuithead mask
负面提示:
Complex Mask, Feral
情境性负面提示:
Tail, Gloves, Shoes, Paws, Anthro
推荐权重范围(最小-最大):
0.4 - 0.8
推荐精确权重范围:
0.55 - 0.75 (视提示而定)
注意事项与考量:
XY 提示未使用推荐的负面提示生成,因此其质量与示例图像存在差异。
当标签前缀为
[\物种\] AND/OR [\毛色/鳞片颜色\] furryzsuithead mask时,LoRA 表现良好(如示例图像所示),但物种越小众、面部结构越不“标准”,其遵循度越低(带有明显吻部的物种表现最佳)。由于训练中使用了“Mask”作为分类器,基础模型中与“面具”相关的颜色和风格(如典型的墨西哥风格面具)可能因提示而渗入;通过提高权重、颜色提示,并在负面提示中加入“Complex Mask”,通常可有效缓解这一问题。
虽然 NSFW 生成通常不需要在正提示中包含“human”,但即使使用推荐的负面提示,SFW 生成仍倾向于生成毛绒玩具动物而非人类,因此在正提示中添加“human”通常是必要的。
我并非 LoRA 训练专家,因此该 LoRA 可能会以不太理想的方式改变图像构图并影响图像其他部分,不过权重越低,这种影响越不明显。
尽管掩码训练有所帮助,但由于训练数据高度依赖提示,预期其他提示标签也会在一定程度上受到影响。
由于训练所用模型是写实模型,而我没有下载非写实模型,因此无法判断它在非写实模型中的表现,欢迎分享你的测试结果!
如果你对如何缓解上述问题有任何建议(无论是当前版本还是未来版本),请告诉我!
OneTrainer 参数:
LoRA 秩:
128
LoRA Alpha:
2
Dropout 概率:
0.01
优化器:
Prodigy
调度器:
Cosine
周期数:
10
每个周期重复次数:
2
学习率(LR):
1
学习率周期数(LR Cycles):
1
批次 + 累计:
1
停止训练文本编码器于:
8 个周期后
停止训练 Unet 于:
永不
噪声权重:
-0.1
噪声偏差:
0.45
非掩码权重 + 概率:
0.09
MSE 强度:
0.75
MAE 强度:
0.25
损失权重函数:
Debiased Estimation
Prodigy 设置:
Beta 1:
0.9
Beta 2:
0.995
EPS:
1e-08
权重衰减:
0.005
解耦:
True
安全预热:
True
偏差校正:
False
初始 D:
1e-06
D 系数:
1
增长率:
inf
















