在 PonyDiffusion-SDXL_v6 上使用约 200 张图像进行训练。
训练配置(kohya):
学习率 2e-4
冻结文本编码器
批量大小 2
梯度累积 4
学习率调度器:余弦
网络维度 16
alpha 8
卷积维度 8
卷积 alpha 4
标签丢弃率 15%
网络丢弃率 30%
分辨率 1024,桶最大分辨率 1024
打乱标题
翻转
ip_noise_gamma 0.02
min_snr_gamma 4
这是一个在PonyDiffusion上训练的简单低投入模型,用于让肚子更下垂。图像来自hyperfusion数据集,因此使用了类似的标签,但唯一重要的标签是"bellysag"和典型的与肚子相关的标签。