ComfyUI Pony/SDXL/Illustrious Easy-Use Detailer Workflow (now with video generation!)
详情
下载文件
模型描述
如果遇到关于 weights_only 设置的错误,请将您的 detailer .pt 文件逐行添加到以下位置:
ComfyUI\user\default\ComfyUI-Impact-Subpack\model-whitelist.txt
这是一个专为使用标准 Stable Diffusion 工具(ControlNet 和 Lora/LYCORIS)生成肖像风格图像并仅通过极少自定义节点进行细节增强而设计的工作流,其结构简洁直观,便于您根据需求灵活增删节点。
其思路是:先生成一张您喜欢的基础图像,然后让系统自动优化它。这样,您可以在第一步就中止不满意的图像,直到选中一个值得继续处理的版本,之后便可放心离开,因为最终结果总会比第一步更好。
欢迎使用 v4 版本(请务必阅读版本说明)
视频生成阶段的资源请参见:
https://blog.comfy.org/p/wan21-video-model-native-support
-
v4 版本新增了基于最终输出和初始提示词,使用 Wan2.1 高级视频生成项目生成视频的功能。
此功能对硬件资源要求极高,处理速度缓慢,且要获得优质输出,您对初始提示词的构思方式必须与仅生成图像时不同。
我不建议在 VRAM 少于 16GB 且系统内存少于 48GB 的设备上尝试视频生成。即使满足这些配置,生成一段 5 秒的视频所耗时间也可能远超工作流其余部分——而后者本身已相当漫长。
请确保您的初始提示词包含明确的动作描述,否则 Wan 可能会生成人类不可能、也不会做的随机行为。
请参阅工作流中视频部分旁的文本块以获取更多信息。
此外,新增了用于种子、步数和 CFG 的全局配置卡片。这允许您统一设置一个值,使其在整个图像生成阶段生效。这意味着您现在可以轻松使用静态种子,在通过 detailer 步骤微调单张图像时,无需在每一步单独修改种子。虽然我仍不建议将 CFG 或步数设得低于默认值,但如果您因硬件性能不足(例如 30 步太慢)而希望降低,此选项已提供。
-
V2+
您可在每个步骤中自由调整和添加相关细节,包括添加文本提示、调整 CLIP 甚至在每个 detailer 阶段添加 Lora。
然而,在 detailer 步骤中添加 Lora 需要特别注意。由于 Ultralytics 检测机制的限制,您在每个阶段能使用的 Lora 受到限制——简言之,Lora 所做的任何修改必须落在检测窗口范围内。一般而言,任何您希望对图像元素进行的大规模调整(如放大或缩小某部分),都应在其对应的 detailer 之上一级或最顶层进行。例如,若您希望使用一个“放大眼睛”效果的 slider Lora,应将其应用于“脸部”detailer,而非“眼睛”detailer(眼睛 detailer 更适合用于增强眼睛细节或真实感的 Lora)。同理,改变胸部大小的 Lora 应应用于“身体”detailer 或最顶层。我已预置了一些我常用的 Lora 作为各阶段适用示例。
我还已在 detailer 栈的最顶部添加了一个 LUT 节点。虽然完全可选,但添加 LUT 可显著提升作品表现力,尤其在户外场景中,能为天空和水面增添电影级的视觉冲击力。您可以免费从 https://freshluts.com/ 下载 LUT 文件——我推荐使用 Rec 709 gamma 模型,因其专为通用图像调色设计,而非特定相机输出。
最后,我使用了出色的 1x_antialiasing 放大模型进行最终放大处理,以获得更干净的最终画面效果。此步骤并不会显著增大图像尺寸,仅作为精细清理步骤。
请注意,添加的 Lora 越多,内存占用越大。若您受 VRAM 限制,请谨慎添加。
感谢您的使用,希望您喜欢这次升级!
-
V1+
我设计此工作流时,确保路径清晰透明——节点间连接直接,无多余模块,同时尽可能减少连接数量,仅在各步骤间保留 2-3 个必要连接。
我专注于消除那些会显著改变原始生成图像的变量,避免您生成一张基础图像后,数分钟后回来却发现结果完全走样。此外,每个步骤都设有“保存点”(图像预览),以便在某个 detailer 步骤出错时,您仍可从中提取可用结果。
本工作流默认针对 NSFW Pony/Pony 写实模型优化,但无需修改即可与 SDXL 模型良好兼容。
若您希望用于 SFW 图像,或某个 detailer 始终无法达到预期效果,您可以将 bbox 检测器更换为其他类型,或通过重连前一步骤的 2-3 条连接线,直接跳过不需要的 detailer。
您可通过简单取消固定并克隆现有 detailer 节点树,再按原方式连接,即可向工作流添加新 detailer。请注意合理放置:全身类 detailer(如衣物)应放在第一次放大前;头部或面部级别 detailer 应放在第二次放大前;而微小细节(如乳头)应在第二次放大后处理。通过这种方式分离 Ultralytics 检测,可确保每个 detailer 步骤拥有最多有效数据,同时最大限度减少不需要的输出。
请注意,此工作流并非快速流程。在我的系统(R7950X / 64GB DDR5 / RTX4090)上,单张图像的平均完整生成时间为 6 至 10 分钟。它专为高 VRAM 系统设计(建议 16GB 或以上,12GB GPU 也可能运行),若您硬件低于此标准,系统将频繁使用系统内存交换,导致速度显著下降甚至无法运行。您可通过降低基础图像尺寸来减少 VRAM 消耗,但同时必须相应调整放大块尺寸(第一次放大块尺寸应等于基础图像尺寸,第二次为 1.5 倍)以及工作流中“放大原始图像”部分的“调整宽度”字段,使其等于最终输出图像宽度。您也可考虑将每个 detailer 的 guide_size 和 max_size 调低,例如设为 1024。
我尚未测试,但理论上可通过调整加载器参数、修改放大块尺寸和调整每个 detailer 的 guide_size/max_size 为 512,使其适配 SD1.5 模型。
您可以将本工作流使用的采样器从 DDIM 更改为其他类型,但结果会因选择而异——某些采样器与 detailer 更兼容,另一些则会在图像流经工作流时引入明显变化。我特意选用 DDIM,因为它是我在测试中发现变异最小、且对写实、半写实、卡通等多种风格均能生成优质输出的采样器。若您决定改用其他采样器,我建议避免使用“祖先采样器”(ancestral samplers),因为在多阶段生成流程中,它们往往导致每一步输出差异过大。无论您选择何种采样器,请在整个工作流中保持一致。步数和种子同理,若更改,请全域统一。CFG 值建议维持在 10 左右——降低 CFG 值会导致工作流中产生不一致性。
衷心感谢 yolain 为本工作流奠定了核心基础——他们开发的易用节点(https://github.com/yolain/ComfyUI-Easy-Use)让我能轻松解决其他 Ultralytics detailer 节点中出现的各种问题,并平滑图像中不希望出现的色调变化——这确实是令人惊叹的成果,且每天都在持续更新。
其他使用资源:
ssitu 的 ComfyUI_UltimateSDUpscale(https://github.com/ssitu/ComfyUI_UltimateSDUpscale)
uwg 的 SwinIR 放大模型(https://huggingface.co/uwg/upscaler/tree/main/SwinIR)——真心推荐,若您还未使用,现在就该开始。
本工作流使用的 Ultralytics 检测模型可在 Civitai、huggingface.co 等平台找到。由于大多数为 .pt 文件,属于“自行承担风险”类别,我不会直接提供链接。






