SDXL Pony Fast Training Guide

本指南解释了我训练角色模型的方法。

使用20张图片，仅需15分钟训练时间即可创建一个SDXL Pony LoRA。

本指南假设您已有使用kohya_ss或sd-scripts进行训练的经验，因此不会详述工具操作细节。

在创建本训练方案时，我参考了以下网址中的优秀指南：/model/281404/lora-training-guide-anime-sdxl

【训练环境】

推荐显存：12GB或更高（已在RTX 4060Ti 16GB上验证可用）

*若使用FP8选项，10GB显存也可训练。

【使用的工具】

kohya_ss GUI：https://github.com/bmaltais/kohya_ss

我通过Stability Matrix安装了kohya_ss：https://github.com/LykosAI/StabilityMatrix

Pony Diffusion V6 XL：/model/257749?modelVersionId=290640

zunko_dataset（20张图片及标签）：https://files.catbox.moe/lnelg0.zip

zunko_Exclude_tag_list.txt：https://files.catbox.moe/2jbc93.txt
kohya_ss预设（zunko_pony_prodigy_v1.json）：https://files.catbox.moe/t5clrs.json

【训练数据】

图片数量：20–40张

超过此数量可能降低可复现性。质量一致性比数量更重要。

最好使用来自同一插画师、动画剧集等、艺术风格一致的图片。

对于同人作品，尽量收集艺术风格尽可能一致的插画。

为此，我参考了日本ZUNKO项目公开发布的AI训练数据：https://zunko.jp/con_illust.html

我选取了20张穿着相同服装的zunko插画，并将768x1024的PNG文件转换为WEBP格式。

* sd-script支持WEBP文件，其体积更小，因此我更倾向使用该格式。

【标签处理】

使用WebUI的wd14tagger重新标注图片：

模型：moat-tagger-v2

权重阈值：默认0.35

选择「Batch from directory」

设置输入和输出目录路径
额外标签："zunko,score_9,source_anime,znkAA"

角色名称：zunko

触发词：znkAA

质量标签：score_9, source_anime
排除标签
- 删除所有角色特征（绿色头发、黄色眼睛、长发等）

- 仅保留一种服装特征（保留"japanese clothes"）

我已附上排除词列表，将该列表粘贴到“排除标签”字段即可获得相同效果。

理想情况下，我们希望将所有特征集中到触发词上，但由于训练步数较少，模型难以学习到"znkAA"代表服装。

因此，我让模型将服装特征吸收进其已认知的“服装”概念——"japanese clothes"，并以"znkAA"作为补充。

- 保留角色姿势、构图及不良物体（蝴蝶结、书籍、食物等）的标签

【开始训练】

启动kohya_ss并选择“LoRA”标签页。注意不要在选中DreamBooth标签页时打开LoRA预设。

我已附上预设文件，请下载后通过设置中的“打开”功能加载。

根据您的环境调整文件路径和源模型路径，并根据您的加速器调整混合精度和保存精度设置（例如fp16）。

基础设置：

优化器：prodigy，学习率调度器：1

维度：16，网络Alpha：2

批次大小：3，重复次数：1，轮数：50

若因显存不足出现OOM错误，请尝试启用fp8训练选项。

在我的设备上，50轮训练耗时14分钟，具体时间取决于您的PC配置。

【结果选择】

最后，检查训练结果并选择您偏好的轮次。50轮仅作为参考，最终轮次不一定最佳。

设置默认每10轮保存一次，但每5轮保存可能更优。

若训练数据与模型匹配良好，模型可能快速收敛。

模型类型	LORA
基础模型	Pony
发布时间	3/15/2024