[Pony] Yuuki Sakuna (結城さくな)

详情

模型描述

结城さくな (Yuuki Sakuna) - 马尾LoRA

免责声明

  • 请勿用我的LoRA生成AI图像并在Twitter/X上标注她的粉丝艺术标签,除非你对该图像有足够贡献。

版本3说明

  • 降低维度/alpha至16/12

  • 使用缩放权重归一化至1.5(防止过拟合)

  • 更换调度器

  • 新数据集 + 新标注

  • 她的笑容不再呈现为 :3,而是更接近 :)

触发词(仅限V3)

  • 默认服装
yuuki sakuna, long hair, blush, animal ears, pink hair, medium breasts, hair ornament, maid headdress, bow, maid, animal ear fluff, puffy sleeves, apron, white dress, bowtie, collarbone, hairclip, hair bow, detached collar, black footwear, shoes, black choker, white thighhighs
  • 任何服装
yuuki sakuna, long hair, blush, cat ears, pink hair, medium breasts, hair ornament, bowtie, hairclip, hair bow

限制

  • 部分服装无法正确更换(因数据集不足)

  • 全身仍不够准确(但已有大幅改进)

版本2说明

  • 使用实验性优化器(似乎对全身效果有提升,但若未明确提示,镜头角度仍不可变)

  • 即使更换服装,蝴蝶结仍会保留

版本1说明

  • 我喜欢猫耳女孩,因此训练了这个LoRA(对她过去一无所知 :<)

触发词

  • 触发词
yuuki sakuna
  • 任何服装(仍不够灵活)
yuuki sakuna, long hair, animal ears, pink hair, blush, cat ears, pink eyes, two side up, ahoge, colored inner hair, two-tone hair
  • 初次登场服装(效果不错,但部分细节仍缺失)
yuuki sakuna, long hair, hair ornament, bow, animal ears, pink hair, blush, cat ears, maid headdress, hair bow, frills, hairclip, pink eyes, pink bow, blue bow, maid, puffy sleeves, two side up, cat hair ornament, ahoge, heart hair ornament, puffy short sleeves, clothing cutout, pink dress, blue bow, colored inner hair, two-tone hair, cleavage, breasts
  • 如需生成全身图,请添加以下内容(但鞋子仍不准确)
shoes, black footwear, white thighhighs

限制

  • 无法正确更换服装(仍残留部分初登场服装元素)

  • 全身效果可能不佳

  • LoRA仍略显欠拟合(像五分熟的猪肉)(版本1)

  • 版本2 改善了一些小细节,但数据集仍不够多样(因图像分布不平衡)

训练详情(版本3)

LoRA尺寸

  • 维度降为8,sv_fro=0.95

数据集

  • 42张图像

参数

  • 分辨率 = 1024

  • 批量大小 = 2

  • 维度/alpha = 16,12(训练时)

  • 混合/保存精度 = bf16/bf16

  • 优化器 = AdEMAMix + weight_decay=0.025 betas=0.9,0.999,0.9999

  • UNet学习率 = 2e-4

  • TE学习率 = 1e-4

  • 调度器 = cosine_with_min_lr(min_lr_ratio 0.67)

  • Huber SNR = 0.85

训练步数

  • 迭代次数 = 5

  • 总步数 = 1575

  • 重复次数 = 15(仅一个概念)

工具

  • kohya-ss GUI v24.3.0(我fork的版本)

  • torch 2.5.0 cu124

  • RTX 3060 12 GB + xformers + gradient_checkpointing

权重

  • UNet平均权重:0.0149531283161857

  • TE1平均权重:0.011002991641968642

  • TE2平均权重:0.009832777519477531

训练详情(版本2)

LoRA尺寸

  • 维度降为8,动态alpha

数据集

  • 38张图像(多数为半身)

参数

  • 分辨率 = 1024

  • 批量大小 = 2

  • 维度/alpha = 16,16(训练时)

  • 混合/保存精度 = bf16/bf16

  • 优化器 = AdEMAMix(32位,占用显存)

  • UNet学习率 = 2e-4

  • TE学习率 = 1e-4

  • 调度器 = inverse_sqrt,暖机100步

  • 仅使用L2损失

训练步数

  • 迭代次数 = 10

  • 总步数 = 2850

  • 重复次数 = 15(仅一个概念)

工具

  • kohya-ss GUI v24.2.0

  • torch 2.5.0 cu124

  • RTX 3060 12 GB + xformers + gradient_checkpointing

权重

  • UNet平均权重强度 = 0.015634962041489377

  • 文本编码器(1)平均权重强度 Clip_L = 0.011193290141749815

  • 文本编码器(2)平均权重强度 Clip_G = 0.010691167576002698

训练详情(版本1)

数据集

  • 38张图像(多数为半身)

参数

  • 分辨率 = 1024

  • 批量大小 = 2

  • 维度/alpha = 16,16(为保留质量未做缩放;若LoRA足够好,会自动处理 :P)

  • 混合/保存精度 = bf16/fp16(意外更改)

  • 优化器 = AdEMAMix8bit

  • UNet学习率 = 1e-4

  • TE学习率 = 5e-05

  • 调度器 = inverse_sqrt,暖机100步

  • Huber SNR,c = 0.85

训练步数

  • 迭代次数 = 10

  • 总步数 = 2850

  • 重复次数 = 15(仅一个概念)

  • 全bf16训练

工具

  • kohya-ss GUI v24.2.0

  • torch 2.5.0 cu124

  • RTX 3060 12 GB + xformers + gradient_checkpointing

权重

  • UNet平均权重强度 = 0.008335085569112463

  • 文本编码器(1)平均权重强度 Clip_L = 0.0073367764333498705

  • 文本编码器(2)平均权重强度 Clip_G = 0.005826970830639767

描述参考自 Gtonero

*本LoRA用于研究新型LoRA训练技术,请勿用于损害该虚拟主播形象(同时请支持她)。

此模型生成的图像

未找到图像。