Fursuit Head LoRA for PonyXL

详情

模型描述

PonyXL 模型的 Fursuit 头部 LoRA

PonyXL 能理解“fursuit”的概念,但无法理解“部分 fursuit”或“fursuit 头部”的概念,即便如此,生成质量也往往参差不齐。

该 LoRA 使用 OneTrainer 和 Prodigy 算法,在 76 张高质量图像上训练了 10 个周期、每个周期重复 2 次。这些图像展示了不同姿势下穿着多种物种 fursuit 头部的人。训练过程中使用了掩码训练和强烈的图像提示,以专注于 fursuit 头部本身的概念。

训练基于一个 Everclear 和 Pony Realism 的自定义模型合并体

数据集由 50% 真实照片和 50% 插画组成,其中 SFW 与 NSFW 的比例为 25:75。尝试了 50% 男性和 50% 女性比例,但数据集主要由男性构成。

推荐设置:

关键词:

furryzsuithead mask

负面提示:

Complex Mask, Feral

情境性负面提示:

Tail, Gloves, Shoes, Paws, Anthro

推荐权重范围(最小-最大):

0.4 - 0.8

推荐精确权重范围:

0.55 - 0.75 (视提示而定)

注意事项与考量:

  • XY 提示未使用推荐的负面提示生成,因此其质量与示例图像存在差异。

  • 当标签前缀为 [\物种\] AND/OR [\毛色/鳞片颜色\] furryzsuithead mask 时,LoRA 表现良好(如示例图像所示),但物种越小众、面部结构越不“标准”,其遵循度越低(带有明显吻部的物种表现最佳)。

  • 由于训练中使用了“Mask”作为分类器,基础模型中与“面具”相关的颜色和风格(如典型的墨西哥风格面具)可能因提示而渗入;通过提高权重、颜色提示,并在负面提示中加入“Complex Mask”,通常可有效缓解这一问题。

  • 虽然 NSFW 生成通常不需要在正提示中包含“human”,但即使使用推荐的负面提示,SFW 生成仍倾向于生成毛绒玩具动物而非人类,因此在正提示中添加“human”通常是必要的。

  • 我并非 LoRA 训练专家,因此该 LoRA 可能会以不太理想的方式改变图像构图并影响图像其他部分,不过权重越低,这种影响越不明显。

  • 尽管掩码训练有所帮助,但由于训练数据高度依赖提示,预期其他提示标签也会在一定程度上受到影响。

  • 由于训练所用模型是写实模型,而我没有下载非写实模型,因此无法判断它在非写实模型中的表现,欢迎分享你的测试结果!

如果你对如何缓解上述问题有任何建议(无论是当前版本还是未来版本),请告诉我!

OneTrainer 参数:

LoRA 秩:

128

LoRA Alpha:

2

Dropout 概率:

0.01

优化器:

Prodigy

调度器:

Cosine

周期数:

10

每个周期重复次数:

2

学习率(LR):

1

学习率周期数(LR Cycles):

1

批次 + 累计:

1

停止训练文本编码器于:

8 个周期后

停止训练 Unet 于:

永不

噪声权重:

-0.1

噪声偏差:

0.45

非掩码权重 + 概率:

0.09

MSE 强度:

0.75

MAE 强度:

0.25

损失权重函数:

Debiased Estimation

Prodigy 设置:

Beta 1:

0.9

Beta 2:

0.995

EPS:

1e-08

权重衰减:

0.005

解耦:

True

安全预热:

True

偏差校正:

False

初始 D:

1e-06

D 系数:

1

增长率:

inf

此模型生成的图像

未找到图像。