Experimental LCM Workflow "The Ravens" for Würstchen v3 aka Stable Cascade

详情

模型描述


重要提示:


此 LCM 工作流极具实验性,并非所有提示词都能正常工作,生成结果可能会断裂——这是正常现象,该工作流旨在一定程度上应对此类问题。请将此工作流视为一种不同于 SDXL 和 SD1.5 的全新图像生成方式,探索 Würstchen v3 架构的新用法。


安装方法:


  1. 从以下链接下载官方 Stable Cascade *.safetensor 文件:

    Stage BStage CCanny

    将 Stage B 和 Stage C 移动至:ComfyUI\models\checkpoints
    将 Canny 移动至:ComfyUI\models\controlnet

  2. 解压下载的 "The Ravens Workflow v01.zip" 压缩包。
    我使用了 sd-perturbed-attention 自定义节点,你可以直接使用我的版本,将文件夹 "sd-perturbed-attention-master" 移动至:ComfyUI\custom_nodes;你也可以从官方 GitHub 页面下载,或以其他你喜欢的方式安装。

  3. 将 "The Ravens Workflow.png" 拖入 ComfyUI 窗口中。


文档:


Würstchen v3,又称 Stable Cascade

"The Ravens" 工作流

v 0.1 印象深刻但缺乏灵魂


要在这短短文本窗口中概括我过去几个月对 Würstchen v3 架构及其使用经验的全部理解,实属不易。因此,目前我将专注于我的总体理念、实用技巧与窍门。我已尽最大努力使此工作流简洁易用。

1. 概念:

我的整个思路围绕 LCM 采样器以及 Cascade 的潜在噪声如何与其互动展开。LCM 采样器生成几何化的噪声模式,这些模式有助于生成图像实现清晰的几何形状、对称和谐、即使在低分辨率下也能获得更好的细节,纹理形状正确,线条清晰笔直,近乎矢量效果。

2. 问题:

但存在一些问题——某些提示词会导致生成结果断裂,出现多种伪影:斑点、线条、白点、扭曲和噪声模式。为应对这些问题,我设计了三阶段工作流:“主阶段、高分辨率修复第一阶段、高分辨率修复第二阶段”。通常,经过完整流程后,所有伪影会变得“更隐蔽”或完全消失。请检查全部三张生成图像,以找出最佳结果,因为最后一张可能过于平滑。

3. 采样器:

两个额外的高分辨率修复阶段并非用于提升分辨率,而是为解决上述问题。在三个阶段组合使用不同的采样器与调度器,有助于让不同提示词正常工作。

LCM-Simple —— 这是你主要使用的采样器,建议始终在所有阶段使用,尤其在“高分辨率修复第一阶段”和“第二阶段”。

Euler-Normal —— 若图像出现严重伪影,则应使用此采样器。首先尝试在“主阶段”的“Stage C”中使用,检查是否有效;若无效,则尝试在“主阶段”的“Stage B”中使用。之后在高分辨率修复阶段按顺序依次更换采样器。

Euler-A-Karras —— 我们的无伪影好友,但几乎不具备 LCM 采样器的效果。用于修复噪声极强的图像,从“主阶段”的“Stage C”开始,然后按相同顺序逐步尝试,寻找最佳点。

Euler-A-Simple —— 若上述方法均无效,且图像混乱、无法响应提示词,则应回归此经典 Cascade 采样器。通常在“主阶段”的“Stage C”中使用即可修复图像;若不行,你懂该怎么做。

你可以尝试为采样器使用不同的调度器,它们对不同情况均有帮助。

4. 分辨率 \ 压缩:

分辨率与压缩因子是个奇妙的变量。它不仅能解决“双头”问题,还能改变整体构图与细节——例如,使用压缩因子 32 和分辨率 1024x1024 生成的像素艺术,其“像素”会比压缩因子 64 时更小,并改变整体风格。

压缩因子 32 —— 适用于 768x768 至 1280x1280 的所有长宽比。

压缩因子 48 —— 适用于 1280x1280 至 1792x1792 的所有长宽比。

压缩因子 64 —— 适用于 1792x1792 至 2304x2304 的所有长宽比。

在较低分辨率或不同长宽比下使用 64 压缩因子,有时也能产生有趣的结果。通常无需更改“高分辨率修复阶段”的压缩因子,因为我们始终希望保留 32 的锐利效果。

5. 步数:

步数越多越好,这是常规,但存在最佳范围:

主阶段 —— Stage C:12-36+(最佳点为 18)

所有高分辨率修复阶段 —— Stage C:6-18+(最佳点为 9)

所有 Stage B:6-12+(最佳点为 6)

别忘了,若你大幅提高 CFG 值,也需相应增加步数。

6. CFG:

CFG 值越高,图像变化越少,颜色会变“烧白”并更明亮;若你希望图像偏暗,请降低 CFG 值。高 CFG 数值会显著增强提示词的效果。

Stage C —— 0.8-18+(最佳点为 2.5)

Stage B —— 保持在 1.5

7. 去噪强度:

不知为何,Cascade 总喜欢加入大量噪声,因此建议保持 0.1 的强度值。若想进行小幅调整,可使用 0.05;若想进行大幅调整,可使用 0.2 或 0.3+。我们的修复目的最佳点为 0.1。

8. 权重:

目前,标记权重无效,请避免使用形如 (词:1.0) 的格式——绝大多数情况下会得到“烧毁”的图像。只需将重要词移到提示词开头以增加其权重即可。

9. PAG:

此实用工具用于影响生成结果,使其更聚焦于细节。但我喜欢用它为同一种子生成变化,通过调整“自适应比例”和“比例”参数实现。

10. 联系方式:

你可通过 civitai.com/user/Tempreddit.com/user/-Ellary- 联系我。

现在向上滚动,找到工作流,运行演示提示词。祝你好运 o/


常见问题:


- 我该如何帮助?

:传播 Stable Cascade 和 Würstchen 架构的资讯,在 CivitAI 和 Reddit 上展示你最棒的生成结果,教导他人如何使用 Stable Cascade。


- “高分辨率修复阶段”之一生成了模糊图像!

:调整“缩放倍数”数值,确保噪点对齐。


- 我喜欢生成的图像,但太暗了!

:提高一个或两个“高分辨率修复阶段”的 CFG 值。


- 如何禁用不同模块?

:"HiRes Fix VAE ENC - R1" 和 "R2" —— 禁用高分辨率修复阶段
"Image Size" —— 禁用主阶段
"APPLY CN" —— 禁用 Control-Net Canny
"CLIP-V CON - I1" 和 "I2" —— 禁用 Clip-Vision


- 如何使用 Img2Img?

:1. 将图像加载到 "Load Image I1"
2. 将 "Upscale Img2Img - to R1" 连接到 "HiRes Fix VAE ENC - R1"
3. 使用 Img2Img 时,通常建议禁用“主阶段”


- 如何使用 Control-Net Canny?

:1. 将图像加载到 "Load Image I1"
2. 启用 "APPLY CN"


- 如何使用 Clip-Vision?

:1. 将图像加载到 "Load Image I1" 或 "Load Image I2"
2. 启用 "CLIP-V CON - I1" 或 "CLIP-V CON - I2"


- 我需要多少显存?

:8GB 显存,16GB 内存已足够。

此模型生成的图像

未找到图像。