The One-Image Workflow: A Forge-Style Static Design for Wan Image, Z-Image, Qwen-Image, Flux2 & Others

详情

模型描述

介绍单图工作流:适用于 Wan 2.1/2.2、Z-Image、Qwen-Image、Flux2 等的 Forge 风格静态设计

作者:Iory98

测试环境:Windows 11,ComfyUI 版本:v0.4.0 | 前端版本:v1.33.13

工作流内包含完整指南

简介与动机:告别“意大利面汤”!

ComfyUI 是一个强大的 AI 生成平台,但其基于图的结构可能令人望而生畏。如果你来自 Forge WebUI 或 A1111,转向管理“意大利面汤”式工作流往往令人疲惫。我一直认为,平台应当让你专注于创作图像,而非工程化图表。

我创建了“单图工作流”来解决这一问题。我的目标是构建一个像用户界面一样运作的工作流。通过利用 ComfyUI 最新的子图(Subgraph)功能,我将混乱整理为一个简洁、静态的工作空间。

为何叫“单图”?

该工作流专注于质量而非数量。它不盲目生成 50 张图像,而是提供一个结构化的三阶段流程,帮助你打造完美的单张图像:先生成构图,再通过模型驱动的高分辨率修复优化细节,最后使用模块化平铺技术将图像放大至 4K。

虽然针对 Wan 2.1 和 Wan 2.2(文生图)进行了优化,但该工作流同样适用于 Qwen-Image、Z-Image,以及任何需要单一文本编码器的模型。

核心理念:三阶段流程

本工作流不仅在于生成图像,更在于完善图像。它遵循模块化逻辑,节省你的时间与显存:

· 阶段一 - 构图(低分辨率):以较低分辨率(如 1088x1088)批量生成图像。速度快,便于挑选最佳构图。

· 阶段二 - 高分辨率修复:选取你最喜欢的一张图像,通过高分辨率修复模块注入细节、优化纹理。

· 阶段三 - 模块化放大:最终使用 Ultimate SD Upscale 模块将分辨率提升至 2K 或 4K。

通过分离这三个阶段,你无需等待数分钟生成一张 4K 图像后,才发现手部变形。

“堆叠”界面:如何导航

本工作流最独特的功能是“堆叠预览系统”。为节省屏幕空间,我将三个图像比较节点堆叠在一起。你无需移动它们,只需折叠顶部节点,即可露出下方的节点。

· 第1层(顶层):当前 vs 上一张 —— 比较你最新生成的图像与上一张。
操作:点击节点标题上的最小化图标,隐藏本层以显示第2层。

· 第2层(中层):高分辨率修复 vs 原图 —— 比较第二阶段的优化结果与原始图像。
操作:最小化本层以显示第3层。

· 第3层(底层):放大后 vs 原图 —— 比较最终超分辨率输出与输入图像。

控制面板(子图)

该工作流分为 7 个彩色编码的子图。可将它们视为网页浏览器中的“标签页”:展开以修改设置,折叠以保持工作区整洁。

1. Wan_Main_Settings(仪表盘)

· 状态:始终展开

· 功能:这是你的主界面,包含你 90% 的操作参数:

o 提示词:正面文本输入

o 生成数据:种子、采样器、调度器、CFG 值、步数

o 图像尺寸:在此设置基础分辨率

o 开关切换:无需断开连线,即可快速启用/禁用精炼器、高分辨率修复或放大阶段

2. Wan_Model_Loaders(设置从此开始)

· 功能:负责加载你的模型检查点

· 双阶段加载:可分别加载主模型(高噪声,用于结构)和精炼模型(低噪声,用于细节)

· 格式自由:支持混合 GGUF 和 Safetensors 格式。你甚至可将 GGUF 版本设为主模型,Safetensors 设为精炼模型,以测试量化差异

3. Wan_Model_Parameters(高级调优)

· 功能:模型的底层技术设置

· 特性

o 模型格式选择:选择模型类型(GGUF 与 Safetensors)

o MagCache 优化:调节显存使用与运行速度的设置

o 默认 LoRA 堆栈:包含 3 个插槽,用于“始终开启”的 LoRA(如 Lightning 或 Turbo LoRA)

4. Wan_Unified_LoRA_Stack

· 功能:集中式 LoRA 加载器

· 逻辑:无需为“主模型”和“精炼模型”分别管理 LoRA,此堆栈将你的风格 LoRA 同时应用于两者。支持最多 6 个 LoRA。当然,此堆栈可与上述“默认(内部)LoRA”协同工作。

· 注意:如需为特定模型单独使用 LoRA,请使用工作流中内置的外部 Power LoRA 加载器。

5. Wan_NAG_Settings(负向提示)

· 功能:管理你希望从图像中排除的内容

· 特性:包含 NAG(归一化注意力引导)设置,通常比标准方法更能准确遵循负向提示。同时管理图像文件名前缀与保存路径。

6. Wan_HiResFix_Settings(第二阶段)

· 功能:优化第一阶段生成的图像

· 建议:使用此模块放大你选定的“草稿”图像。它采用重噪声技术,为低分辨率图像中缺失的细节注入真实感。

7. Wan_Upscaler_Settings(第三阶段)

功能:最终润色,将图像分辨率提升至超出模型原生能力的范围。

模块:使用 Ultimate SD Upscale

逻辑:支持平铺放大,是实现 4K 分辨率而不耗尽显存的关键。你可以将原始图像或高分辨率修复后的图像输入此模块。

要求与安装

要使用此工作流,你必须已安装 ComfyUI Manager。加载工作流后,点击“安装缺失的自定义节点”。

主要使用的自定义节点:

· rgthree-comfy:用于静音开关和图像比较节点

· ComfyUI Impact Pack:用于高级工作流逻辑

· ComfyUI-Easy-Use:用于简化参数处理

· ComfyUI-KJNodes:用于界面增强

· UltimateSDUpscale:用于第三阶段放大

· ComfyUI-GGUF:如使用 GGUF 量化模型则必需

· Was Node Suite:用于各类输入/输出任务

快速入门指南

  1. 加载模型:打开 Model_Loaders 子图,选择你的 Wan 2.1(或其他)检查点。

  2. 设置分辨率:在 Main_Settings 中设置一个快速预览分辨率(如 832x1216 或 1024x1024)。

  3. 输入提示词:在 Main_Settings 或连接的正面提示词字段中输入文本。

  4. 生成:点击“排队提示”。

  5. 查看:观察顶层“当前 vs 上一张”预览。

  6. 优化(可选):若你喜欢当前种子,开启 Main_Settings 中的“启用高分辨率修复”,重新生成以精细润饰细节。折叠顶层预览以查看结果。

此模型生成的图像

未找到图像。