Nabby's SDXL Single/Batch Outpainting to Target Size

详情

模型描述

大家好,欢迎来到我在 CivitAI 的首次上传!

我制作这个工作流是为了满足我一个特定的需求——批量处理大量不同尺寸的潜在图像,用于 LORA/检查点训练。训练时无法跨桶批量处理,因此我更倾向于让所有训练图像尺寸一致,或分成少数几个匹配的尺寸——尤其是现在有了 Flux,能够将所有图像统一为正方形。但我并不喜欢裁剪图像而丢失重要细节。之前我也尝试过给图像添加空白填充,但这种填充偶尔会出现在用我的 LORA 生成的带黑边图像中。最终,我想到使用外绘(outpainting)来填充空白区域——但如何高效地批量实现这一点呢?

这个工作流最初提供两个选项:从文件夹批量处理图像,或处理单张图像。若选择批量处理,请务必在 ComfyUI 控制面板中勾选“额外选项”,并将批量大小设置为您的批量文件夹中的图像数量;若处理单张图像,则将其改回 1。批量加载节点仅知道处理一张图像后,再跳转到下一张。而 ComfyUI 中的批量计数框则告诉系统:对每一张后续图像,重复整个流程。

对于每张图像,此工作流会调用 BLIP 标签生成用于外绘图像的正向提示词。此外还有一个附加提示词部分,允许您添加自定义的正向和负向提示词,这些将被合并到生成的提示中。在模型部分,您可以选择已下载的不同 BLIP 模型,以及在处理部分调整 BLIP 分析器的各种参数。

您还可以选择用于生成图像的主要检查点——强烈建议使用内绘(inpainting)检查点。我使用的是 AIDutcHY 的 epicrealismXL_v8Kiss 内绘模型合并体,效果极佳。

epiCRealism XL 内绘 > /model/590835/epicrealism-xl-inpainting

原始模型致谢:

https://civitai.com/articles/3990

/model/277058

编辑:我还想特别感谢 Jonas716 的 ImgFixer PreV0.3 嵌入模型。

我将它添加到我的正向提示框后,外绘图像的质量显著提升。

/model/139688/imgfixer-or-negative-ti

输出图像尺寸组中,我预设了用于生成 1024x1024 最终图像的参数。您可自行修改,但可能需要调整羽化和扩展遮罩设置以获得良好效果。我目前对 1024x 图像使用扩展遮罩 32 和羽化 128,以避免出现明显接缝并保持一致性。左侧的框会按原比例缩放输入图像至目标尺寸,右侧的框则将结果居中放置于其目标尺寸中,并用外绘遮罩填充剩余空间。如果您希望在图像四周都生成外绘边框,可以设置比目标外绘尺寸更小的初始图像尺寸。此外,虽然我倾向于提前将图像分组,确保仅进行缩小,但如果您选择允许加载小于目标尺寸的图像,也提供了可选的上采样方法。

最后,由于外绘效果不稳定,选择性(Selective) 工作流为每张输入图像生成四个潜在输出,并发送至预览选择器。您将在输出图像设置中找到四个 KSampler 框,可分别为每个流选择采样器、调度器、步数等参数。这不是“设置好就不管”的批量处理流程。您必须从每张图像的四个外绘选项中手动挑选最满意的一个。很可能仍会有一些失败图像,因此提供了单图处理选项,以便单独重试失败项。

作为替代,自动(Automatic) 工作流支持最多四个独立激活的图像流。每个批量加载的图像都会依次通过每个激活的流,生成并保存独一无二的外绘结果。此外,每个流均可独立设置调度器、步数、CFG 等参数,以及独立的保存文件前缀和输出文件夹。

** 新增功能 **

您喜欢选择性模式,但没花超跑的价格购买 H100,且等待每组四张图像生成的过程令人煎熬?

您喜欢自动模式的便利——点击“排队提示”后稍后再回来,但讨厌手动删除所有废图?

现在,您能兼得两者之长。自动 v2.0 插件是一个简单的文件选择器工作流,可一次性加载任意数量的图像至网格,让您手动选择保留哪些。它不触发任何生成过程,因此 VRAM 需求极低,几乎瞬时加载。

同样,您可以使用 ComfyUI 的批量计数框自动切换到下一组,也可以每次只需点击“排队提示”加载下一组。手动推进的优点是:即使您不选择任何图像,也能直接跳到下一组,若判定当前整组都是废图,可完全不保存。

它也不关心图像来源,因此您无需绑定我的工作流使用。它能处理您任何包含匹配图像集的文件夹,供您从中挑选最爱。

工作流中已包含说明,告知您如何根据每组图像数量和文件夹总图像数设置几个基本参数,还提供一个布尔节点,以便在需要时将计数器重置为零,从头开始处理整个文件夹。

安装 / 系统要求说明:

先说声抱歉,这个流程图有点复杂(像一盘意面),但我已尽量简化。若您在设置中将链接设为“直线”,仍能清晰看出流程走向。

可通过管理器安装的自定义节点:WAS Node Suitergthree's ComfyUI NodesKJNodes for ComfyUI。请确保您的节点为最新版本。此前 KJNodes 版本存在一个错误,导致“目标图像”节点无法使用正确尺寸。您也可安装 ComfyUI Essentials 以启用遮罩预览节点,但该节点主要用于测试,如不需要可直接删除。

您还需要从 Git 安装的自定义节点:cg-image-picker

https://github.com/chrisgoringe/cg-image-picker

若您尚未安装 BLIP 模型,系统会自动从 HuggingFace 下载我所使用的版本。首次运行时,BLIP 分析阶段会暂停片刻以下载模型,待下载完成后将继续执行。如需手动安装,可从以下链接获取并放置于您的 models/blip 文件夹中:

https://huggingface.co/Salesforce/blip-image-captioning-base

https://huggingface.co/Salesforce/blip-vqa-base

此模型生成的图像

未找到图像。