ComfyUI Multi-Subject Workflows
详情
下载文件
关于此版本
模型描述
这是一组为 ComfyUI 设计的自定义工作流
它们能够生成多个主体,每个主体拥有各自独立的提示词(prompt)。
这些工作流需要一些自定义节点才能正常运行,主要是为了自动化或简化设置过程中的繁琐操作。
若需安装任何必要的自定义节点,最佳方式是获取 ComfyUI Manager,然后进入管理器,点击“安装缺失的自定义节点”。若仍有缺失节点,请参考对应工作流“关于此版本”部分列出的依赖项。
最近更新的工作流:
潜空间情侣姿态(Latent Couple Pose)(原名:LoRA 潜空间情侣)— 新增工作流,但从用户使用体验来看,它与“区域 LoRA”和“区域 LoRA+”非常相似,只是采用了更新、更高效的方法,允许将 LoRA 模型绑定到条件区域,从而实现整个图像仅用一次采样完成,而非分别对各区域独立采样。如果您之前使用过上述工作流,本次体验基本一致。该工作流因具备全部功能且表现更优,已使“区域 LoRA”、“区域 LoRA+”以及“交互式 OpenPose”工作流变得冗余,故将逐步停止维护。
潜空间情侣(Latent Couple) — 已更新以适配当前的 ComfyUI 和自定义节点版本。新增 LoRA 支持。由于现已支持区域条件 LoRA,因此原名为“LoRA 潜空间情侣”的命名已不再合适,已进行更名。
在重制“潜空间情侣”时,我意识到这两个活跃工作流在当前阶段已极为相似,理论上可合并为一个而不造成问题。但最终我选择不合并,以避免引入复杂的路径逻辑,并保持各工作流的专注性。
以下是使用“潜空间情侣姿态”功能的演示视频:
- “潜空间情侣”目前已暂时标记为已弃用,正在开发更新版本。
请从模型版本页面下载,而非“更新通知推送”页面,因为每次发布新版本时,我都会删除并重建“更新通知推送”版本以推送通知,而删除版本会导致其上的统计数据、评论和评分全部丢失。
潜空间情侣 vs 潜空间情侣姿态
目前这两个工作流非常相似,主要区别在于“潜空间情侣姿态”额外使用了 OpenPose ControlNet 提供引导信息。表面上看,这一设计似乎更复杂,原因在于默认情况下,我们优先生成一张图像,通过 OpenPose 预处理器获取 ControlNet 所需图像,从而无需加载外部资产——此过程需在流程开始处添加一个基本的 T2I 工作流。但该过程可轻松替换为使用预先准备好的姿态图像加载器。
姿态版本在复杂场景下能生成更精确的图像,但同样的复杂场景也增加了预处理器提取姿态信息的难度,因此 paradoxically(讽刺性地),让 AI 在更基础的“潜空间情侣”中自由发挥反而可能因偶然获得更佳结果。与默认使用图像中提取姿态的方法相比,若为“潜空间情侣姿态”提供来自 OpenPose 编辑器的预制作姿态,则结果始终更优。我本希望将此类编辑器整合进工作流中,这将是一个巨大提升,尤其若能在工作流中直接提供初始姿态和背景图(因线条人难以准确判断),但遗憾的是,目前没有任何此类工具仍被良好维护。
工作流:
潜空间情侣
通过将不同提示词应用于图像的不同区域,实现对图像构图更精细的控制。
根据我的测试,它通常优于“噪点潜空间构图”(Noisy Latent Composition)。
这是 ComfyUI 中相当标准的用法,仅额外集成了部分来自自定义节点的用户体验优化功能。
噪点潜空间构图(已弃用)
在前几步(如 4/20 步)中,分别对每个提示词生成独立图像,仅形成主要元素的大致轮廓,然后将其合并,并用“潜空间情侣”完成剩余步骤。
这在 ComfyUI 中属于常规做法,也整合了一些来自自定义节点的体验优化功能。
角色互动(潜空间)(已弃用)
首先,若你追求实际可用的效果,请尝试“角色互动(OpenPose)”或“区域 LoRA”。本工作流并不真正生效,仅留作归档用途。
此为尝试在不使用 ControlNet 的情况下生成两个角色之间的互动,同时保持对其外观的高度控制。结果极其不稳定且不可靠。
我们通过在单一提示词下处理前几步(如 6/30 步)完成整个图像的生成,该提示词需描述预期的互动内容(+背景 和 两位角色的共同特征也有帮助)。
随后在第二个 KSampler 中,对剩余步骤添加两个新的提示词,分别对应每个角色,限制范围为其“预期”(推测)出现的区域,通常为图像的左半部分/右半部分,并有部分重叠。
坦白说,结果和一致性都不佳。若你愿意尝试,可调整的参数包括:KSampler 切换的时间点、角色提示词之间的重叠程度、提示词强度。根据我的测试,我能实现的最接近互动效果是接吻,尝试拥抱却未能成功。
切换 KSampler 的步数越高,获得预期互动的稳定性越强,但角色提示词的影响会减弱(我建议在总步数的 20%-35% 之间调整)。你或许可通过提升角色提示词强度部分抵消这一影响。
潜空间情侣姿态
此工作流应紧随“角色互动(OpenPose)”与“区域 LoRA”的说明之后呈现,但为使其更醒目且内容完整,目前置于上方。下方工作流均已弃用。
此工作流采用与上述类似的方法,展示的示例图像同样适用于本工作流。主要区别在于:我们不再使用区域采样(Regional Sampling),转而采用更新且更优的 LoRA 钩子(hook)机制,可在一次采样中完成整张图像生成,无需分别采样每个 LoRA 区域。
角色互动(OpenPose)(已弃用)
另一种生成角色互动的方法,这一次真正有效,且效果极其稳定。实现方式为在潜空间构图中混合使用 OpenPose ControlNet。为便于使用,OpenPose 图像可预先生成,无需手动输入预制作图像。因此整体流程相较于普通生成过程并不复杂。可在导入至 ComfyUI 后,查看工作流内的说明获取使用指南。
从技术角度看,实现过程比简单应用 OpenPose 稍显复杂。由于我们需处理总共 3 个(或更多)条件输入(背景 + 两位角色),直接对全部三个应用 ControlNet(无论在合并前或后)会导致问题:背景图像上的 OpenPose 应用正确(OpenPose 图像尺寸与背景一致),但角色图像上的 OpenPose 被压缩以适配其尺寸,最终产生 3 张未对齐的 ControlNet 图像。因此,我们只能将未修改的 OpenPose 图像应用于背景。然而,若仅至此处,角色将完全缺乏 ControlNet 引导,生成结果将与 OpenPose 图像无关。
因此,我们必须裁剪 OpenPose 图像中与角色区域相对应的部分,并将这些裁剪后的部分分别应用于每个角色的条件输入,在合并为最终条件之前完成。只有完成此步骤,才能生成最终图像。
下图展示了最终的条件构型:
顺便提一句,工作流会为你自动生成类似的构型图 :)
背景条件覆盖整张图像,包含全部姿态数据。
角色1以绿色区域表示,其内包含该区域对应的姿态裁剪图。
角色2以蓝色区域表示,其内包含该区域对应的姿态裁剪图。
图像首先生成,随后从图像中提取姿态数据,裁剪并应用至条件中,最终用于生成正确图像。这免去了你需要手持可用的 OpenPose 图像的麻烦。
以下是最终生成结果:

该结果包含超分处理后的二次迭代、人脸修复以及最终再次超分,全部步骤均包含在工作流中。
同时生成了条件区域的便捷预览图(见上图)。理想情况下,应在图像正式生成前完成,但目前 ComfyUI 尚未实现相关控制逻辑,因此有时该预览图反而是最后一步。对此我目前也无能为力。
更多使用相关信息已在工作流内部说明。
区域 LoRA / 区域 LoRA PLUS
如名称所示,这些工作流允许你将 LoRA 模型应用于图像的指定区域。
例如:生成两位角色,分别使用不同 LoRA 与不同艺术风格;或为同一角色,面部应用一套 LoRA,身体其余部分应用另一套 LoRA —— 例如cosplay效果!
区域 LoRA 与区域 LoRA PLUS 的区别是什么?
区域 LoRA 仅支持 2 个区域 —— 你绘制一个遮罩,被遮罩区域为区域1,其余为区域2。
区域 LoRA PLUS 支持任意数量区域,但需为每个区域分别绘制遮罩(与“互动式 OpenPose”类似)。
因此,若仅需 2 个区域,基础版更易使用,且能保证区域完美对齐。
此外,目前 PLUS 版本无法在超分后使用区域采样,因缺少关键节点,若强行实现将导致流程极度复杂。
它是如何运作的?
关键在于 Impact Pack 和 Inspire Pack 由 ltdr.data 提供的“区域采样”节点。它们允许我们根据遮罩区域使用不同的采样器生成图像部分。这意味着我们可以为不同区域设置不同的 LoRA 模型,甚至对遮罩区域与非遮罩区域使用不同的模型检查点(checkpoint)。这是核心机制,但显然并不仅仅是拉来节点就能完成。完整流程如下:
首先,使用真实风格检查点生成目标姿态图像,并通过 OpenPose ControlNet 预处理器处理:

下一步进入“预览桥接”节点(Impact Pack 提供的另一节点),该节点本质上是一个可绘制遮罩的预览图像节点,同时输出图像与遮罩。上述图像将在此处呈现。完成该步骤后,停止图像生成,将图像在“遮罩编辑器”中打开,可如下对角色之一绘制遮罩:

随后,沿遮罩边界裁剪 ControlNet 图像,并将其应用至对应区域的条件输入。得益于 ControlNet,图像在视角上保持一致,可实现不同区域角色间的互动。这些区域遮罩也决定了负责清晰 LoRA 分离的采样区域。
最终效果:

左侧:星街彗星 星街すいせい / Hololive
右侧:异世界情绪 Isekai Joucho Nemophila ver

