SDXL config ComfyUI Fast generation 4GB vRAM (refiner)
详情
下载文件
关于此版本
模型描述
大家好,
我尝试使用 SDXL 1.0,但我的配备 RTX 3050 笔记本电脑(4GB 显存)无法在 3 分钟内生成图像。于是,我花了一些时间优化 ComfyUI 的配置,现在我可以实现 55 秒(批量图像)– 70 秒(检测到新提示)的生成速度,并在精炼器启动后获得出色的效果。
这是我能找到的在图像尺寸(1024x720)、模型、步数(10+5 精炼)、采样器/调度器之间最佳平衡的配置,让我们可以在笔记本电脑上使用 SDXL,而无需昂贵或笨重的台式机 GPU。
我想分享我的 ComfyUI 配置,因为大多数人都主要使用笔记本电脑。我认为这是我找到的最平衡的方案。
在 "run_nvidia_gpu.bat" 中添加参数:--normalvram --fp16-vae
面部修复快速版?
SDXL 在人脸远离“镜头”(小脸)时存在很多面部问题,因此这个版本仅对检测到的人脸进行修复,并额外增加 5 步处理。
面部修复无快速版?
对于非快速版面部修复,人脸在超分辨率之后进行修正,效果更好,尤其对极小人脸更佳,但比快速版多耗时 20 秒。
如果面部修复输出未生成不同图像(可能你在使用 4x 超分辨率),且控制台打印出 “segment skip [determined upscale factor=0.9875809267424535]”,请在模块 “FaceDetailer” 中将 “guide_size” 从 1280 提高到 1408 或更高,直到 FaceDetailer 被激活。
LORA 与 LORA 快速版的区别?
如果选择 LORA 快速版,可节省 20–30 秒。
LORA 快速版在精炼器之后没有额外的 3 步来重新强化 LORA 效果,精炼器会削弱 LORA 的影响。对于某些自定义风格的 LORA,最后 3 步是必要的,以重新增强效果。但在大多数情况下不需要,仅推荐用于风格变化极大的自定义 LORA。
生成时间(第一张图像之后):
无 LORA: 55–60 秒
有 LORA: 85–115 秒
有 LORA 快速版: 75–80 秒
有面部修复: 80 秒(快速修复面部)– 110 秒(慢速修复面部)
可下载文件:
精炼器 SDXL 1.0: https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-1.0
模型 Dreamshaper SDXL 1.0(或其他模型): /model/112902/dreamshaper-xl10
修复版 SDXL VAE 16FP: https://huggingface.co/madebyollin/sdxl-vae-fp16-fix (将 config.json、diffusion_pytorch_model.safetensors 和 sdxl_vae.safetensors 文件放入 VAE/
文件夹中) 超分辨率模型(RealESRGAN 或 Swin2SR):
https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.1/RealESRGAN_x2plus.pthhttps://github.com/mv-lab/swin2sr/releases/download/v0.0.1/Swin2SR_Lightweight_X2_64.pth
LORA 版本使用: /model/117635/greg-rutkowski-style-lora-sdxl
面部修复版本使用(FaceDetailer):
ComfyUI/models/sams: https://dl.fbaipublicfiles.com/segment_anything/sam_vit_b_01ec64.pth




