SDXL config ComfyUI Fast generation 4GB vRAM (refiner)

详情

模型描述

大家好,

我尝试使用 SDXL 1.0,但我的配备 RTX 3050 笔记本电脑(4GB 显存)无法在 3 分钟内生成图像。于是,我花了一些时间优化 ComfyUI 的配置,现在我可以实现 55 秒(批量图像)– 70 秒(检测到新提示)的生成速度,并在精炼器启动后获得出色的效果。

这是我能找到的在图像尺寸(1024x720)、模型、步数(10+5 精炼)、采样器/调度器之间最佳平衡的配置,让我们可以在笔记本电脑上使用 SDXL,而无需昂贵或笨重的台式机 GPU。

我想分享我的 ComfyUI 配置,因为大多数人都主要使用笔记本电脑。我认为这是我找到的最平衡的方案。

在 "run_nvidia_gpu.bat" 中添加参数:--normalvram --fp16-vae

面部修复快速版?

SDXL 在人脸远离“镜头”(小脸)时存在很多面部问题,因此这个版本仅对检测到的人脸进行修复,并额外增加 5 步处理。

面部修复无快速版?
对于非快速版面部修复,人脸在超分辨率之后进行修正,效果更好,尤其对极小人脸更佳,但比快速版多耗时 20 秒。

如果面部修复输出未生成不同图像(可能你在使用 4x 超分辨率),且控制台打印出 “segment skip [determined upscale factor=0.9875809267424535]”,请在模块 “FaceDetailer” 中将 “guide_size” 从 1280 提高到 1408 或更高,直到 FaceDetailer 被激活。

LORA 与 LORA 快速版的区别?

如果选择 LORA 快速版,可节省 20–30 秒。

LORA 快速版在精炼器之后没有额外的 3 步来重新强化 LORA 效果,精炼器会削弱 LORA 的影响。对于某些自定义风格的 LORA,最后 3 步是必要的,以重新增强效果。但在大多数情况下不需要,仅推荐用于风格变化极大的自定义 LORA。

生成时间(第一张图像之后):

无 LORA: 55–60 秒

有 LORA: 85–115 秒

有 LORA 快速版: 75–80 秒

有面部修复: 80 秒(快速修复面部)– 110 秒(慢速修复面部)

可下载文件:

此模型生成的图像

未找到图像。