SDXL_fixedvae_fp16(Remove Watermark)

详情

模型描述

这是一个融合模型,用于:

  1. 100% stable-diffusion-xl-base-1.0 和 100% stable-diffusion-xl-refine-1.0

https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0

https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-1.0

  1. sdxl-vae-fp16-fix

https://huggingface.co/madebyollin/sdxl-vae-fp16-fix

您可以直接使用此模型,或进行微调。

许可证与 stable-diffusion-xl-base-1.0 相同

VAE 许可证与 sdxl-vae-fp16-fix 相同

SDXL-VAE-FP16-Fix

SDXL-VAE-FP16-Fix 是 SDXL VAE 的修改版本,可在 fp16 精度下运行且不生成 NaN 值。

float32 / bfloat16 精度下解码 float16 精度下解码SDXL-VAE✅⚠️SDXL-VAE-FP16-Fix✅

详细说明

SDXL-VAE 在 fp16 下生成 NaN 是因为其内部激活值过大:

SDXL-VAE-FP16-Fix 是通过对 SDXL-VAE 进行微调实现的,目标是:

  1. 保持最终输出不变,但

  2. 通过

  3. 缩小网络内部的权重和偏置,使内部激活值变小

SDXL-VAE-FP16-Fix 与 SDXL-VAE 的输出存在细微差异,但解码后的图像在大多数用途下已足够接近。

来自 此处 的基准测试:由 Kubuxu 提供

https://huggingface.co/madebyollin/sdxl-vae-fp16-fix/discussions/7

在 COCO val-2017 上评估,256x256,随机裁剪加填充
指标:
LPIPS:
https://github.com/richzhang/PerceptualSimilarity/ (数值越低越好)和通过 skimage.metrics 计算的结构相似性指数(数值越高越好)
指标格式:均值 [79% 置信区间]

此模型生成的图像

未找到图像。