SDXL VAE finetune + VAE training script
详情
下载文件
模型描述
这是我对于SDXL的VAE进行微调的v1版本尝试,我也想分享一下训练脚本。脚本本身可以在GitHub上找到:https://github.com/kukaiN/vae_finetune
我正在度假期间进行这些操作,因此抱歉描述较为简略。微调脚本的README中包含了原始脚本的来源,以及我为实现混合精度和将模型键从diffusers格式转换为SD格式所作的修改。
我发布的是我首次尝试VAE训练的v1版本,但这次失败了。我使用了约6万张动漫图像(来自我的检查点数据)对模型进行了5个epoch的微调。当我比较模型权重的差异以及底层权重的余弦相似度时,确实能看到模型得到了训练,但似乎使用bf16和低学习率并没有使微调后的VAE产生明显变化。尽管模型哈希值不同,但差异还不够显著,无法产生可察觉的效果。
我计划再进行一个2个epoch的训练版本,使用fp16和更高的学习率,看看会发生什么。

