SDXL_fixedvae_fp16(Remove Watermark)
详情
下载文件
关于此版本
模型描述
这是一个融合模型,用于:
- 100% stable-diffusion-xl-base-1.0 和 100% stable-diffusion-xl-refine-1.0
https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0
https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-1.0
- sdxl-vae-fp16-fix
https://huggingface.co/madebyollin/sdxl-vae-fp16-fix
您可以直接使用此模型,或进行微调。
许可证与 stable-diffusion-xl-base-1.0 相同
VAE 许可证与 sdxl-vae-fp16-fix 相同
SDXL-VAE-FP16-Fix
SDXL-VAE-FP16-Fix 是 SDXL VAE 的修改版本,可在 fp16 精度下运行且不生成 NaN 值。
在 float32 / bfloat16 精度下解码在 float16 精度下解码SDXL-VAE✅
⚠️
SDXL-VAE-FP16-Fix✅
✅
详细说明
SDXL-VAE 在 fp16 下生成 NaN 是因为其内部激活值过大:

SDXL-VAE-FP16-Fix 是通过对 SDXL-VAE 进行微调实现的,目标是:
保持最终输出不变,但
通过
缩小网络内部的权重和偏置,使内部激活值变小
SDXL-VAE-FP16-Fix 与 SDXL-VAE 的输出存在细微差异,但解码后的图像在大多数用途下已足够接近。
来自 此处 的基准测试:由 Kubuxu 提供
https://huggingface.co/madebyollin/sdxl-vae-fp16-fix/discussions/7
在 COCO val-2017 上评估,256x256,随机裁剪加填充
指标:
LPIPS: https://github.com/richzhang/PerceptualSimilarity/ (数值越低越好)和通过 skimage.metrics 计算的结构相似性指数(数值越高越好)
指标格式:均值 [79% 置信区间]





