vae-teding-aliased-2024-03

详情

模型描述

https://huggingface.co/thomaseding/vae-teding-aliased-2024-03

(如果要将此模型与我的PixelNet模型配合使用,请使用宽高均为8的倍数的checker方块。)

这是一个针对Stable Diffusion 1.5微调的VAE解码器,通过使解码器输出产生别名效应,以提升像素艺术生成质量。该VAE的质量依赖于像素艺术模型在训练时使用的是8的倍数大小的“图块”。否则,你将看到类似接缝的伪影。

微调过程使用了5万张图像,单轮训练的有效批次大小为12。我预先处理了这些图像,将每个8x8图块量化为其平均颜色。在RTX 3090上,微调耗时约4小时。仅使用均方误差(MSE)损失,学习率为1e-5。训练数据集由其他Stable Diffusion模型生成,主要为卡通风格图像。

此模型生成的图像

未找到图像。