Experimental LCM Workflow "The Ravens" for Würstchen v3 aka Stable Cascade

세부 정보

파일 다운로드

모델 설명


중요 참고사항:


이 LCM 워크플로우는 매우 실험적이며, 모든 프롬프트가 올바르게 작동하지 않을 수 있으며, 생성 결과가 깨질 수 있습니다. 이는 정상적인 현상입니다. 이 워크플로우는 이러한 문제들을一定程度 방지하도록 설계되었습니다. 이 워크플로우를 SDXL 및 SD1.5와 다른 새로운 이미지 생성 방식으로 간주하고, Würstchen v3 아키텍처를 활용하는 새로운 방법을 탐색해보세요.


설치 방법:


  1. 공식 Stable Cascade *.safetensor 파일을 다음 링크에서 다운로드하세요:

    Stage B , Stage C , Canny

    Stage B 및 Stage C를 - ComfyUI\models\checkpoints로 이동하세요.
    Canny를 - ComfyUI\models\controlnet으로 이동하세요.

  2. 다운로드한 "The Ravens Workflow v01.zip" 압축 파일을 풀어주세요.
    저는 sd-perturbed-attention 커스텀 노드를 사용하고 있으며, "sd-perturbed-attention-master" 폴더를 ComfyUI\custom_nodes로 이동하실 수 있습니다. 또는 공식 GitHub 페이지에서 다운로드하거나 원하는 방식으로 설치하실 수 있습니다.

  3. "The Ravens Workflow.png" 파일을 ComfyUI 창 내로 이동하세요.


문서:


Würstchen v3, 즉 Stable Cascade

"The Ravens" 워크플로우

v 0.1 인상적이나 정신 없는


지난 몇 달 동안 Würstchen v3 아키텍처에 대해 쌓은 지식과 경험을 이 짧은 텍스트 창에 모두 담기는 어렵습니다. 따라서 지금은 일반적인 아이디어, 실용적인 팁과 트릭에 집중하겠습니다. 이 워크플로우를 깔끔하고 사용하기 쉽게 만드는 데 최선을 다했습니다.

1. 개념:

저의 전체 개념은 LCM 샘플러와 Cascade의 잠재적 노이즈가 어떻게 상호작용하는지에 중심을 두고 있습니다. LCM 샘플러는 기하학적 노이즈 패턴을 생성하며, 이 패턴은 생성물이 깨끗한 기하학적 형태, 대칭적 조화, 낮은 해상도에서도 더 나은 디테일, 정확한 질감, 선명하고 직선에 가까운 선들을 달성하도록 돕습니다.

2. 문제점:

그러나 일부 생성물이 특정 프롬프트에서 깨지는 문제가 있습니다. 점, 선, 흰색 자국, 왜곡 및 노이즈 패턴 등 다양한 아티팩트가 나타납니다. 이를 해결하기 위해 이 3단계 워크플로우를 만들었습니다: "메인 패스, 고해상도 보정 1차 패스, 고해상도 보정 2차 패스". 일반적으로 전체 프로세스를 거친 후 모든 아티팩트가 더 "숨겨지거나" 완전히 사라집니다. 3개의 생성된 이미지를 모두 확인하여 가장 좋은 결과를 선택하세요. 마지막 이미지가 너무 매끄러울 수 있습니다.

3. 샘플러:

두 개의 추가 고해상도 패스는 해상도를 높이기 위한 것이 아니라 문제를 해결하기 위한 것입니다. 3단계 모두에서 다양한 샘플러와 스케줄러를 조합하면 다양한 프롬프트가 제대로 작동하도록 도와줍니다.

LCM-Simple - 메인 샘플러로, 모든 단계에서 사용하세요. 특히 고해상도 1차 및 2차 패스에서 반드시 사용하세요.

Euler-Normal - 이미지에 심각한 아티팩트가 발생할 때 사용하세요. 먼저 "메인 패스"의 "Stage C"에서 사용하고, 효과가 없다면 "메인 패스"의 "Stage B"에서 사용하세요. 이후 고해상도 패스에서도 체인처럼 샘플러를 변경하며 시도하세요.

Euler-A-Karras - 아티팩트가 없는 친구이지만 LCM 샘플러의 효과가 거의 없습니다. 매우 노이즈가 많은 이미지를 수리할 때 사용하세요. "메인 패스"의 "Stage C"에서 시작하여 같은 체인 방식으로 이동하며 최적의 지점을 찾으세요.

Euler-A-Simple - 위의 모든 방법이 효과가 없고 이미지가 엉망이며 프롬프트에 반응하지 않을 때, 이 오래된 베일라나 Cascade 샘플러로 돌아가세요. 일반적으로 "메인 패스"의 "Stage C"에서 사용하면 이미지가 수리됩니다. 그렇지 않다면 무엇을 해야 할지 알고 계실 겁니다.

샘플러에 다양한 스케줄러를 시도해보세요. 모두 다른 부분에 도움이 됩니다.

4. 해상도 \ 압축:

해상도 및 압축 계수는 꽤 특이한 존재입니다. "두 개의 머리" 문제를 해결할 뿐 아니라 전체 구성과 디테일을 변화시킬 수도 있습니다. 예를 들어, 압축률 32와 해상도 1024x1024로 생성된 픽셀아트는 압축률 64일 때보다 더 작은 "픽셀"을 생성하고 스타일이 달라집니다.

압축 32 - 모든 종횡비에서 768x768에서 1280x1280까지 작동합니다.
압축 48 - 모든 종纵横비에서 1280x1280에서 1792x1792까지 작동합니다.
압축 64 - 모든 종횡비에서 1792x1792에서 2304x2304까지 작동합니다.

낮은 해상도 및 다양한 종횡비에서 64 압축을 사용하면 흥미로운 결과를 얻을 수 있습니다. 일반적으로 "고해상도 보정 패스"에서는 항상 32의 선명한 외관을 원하므로 압축률을 변경할 필요가 없습니다.

5. 스텝:

항상 그렇듯, 스텝이 많을수록 좋지만 최적의 지점이 있습니다:

메인 패스 - Stage C: 12-36+(최적: 18)
모든 고해상도 패스 - Stage C: 6-18+(최적: 9)
모든 Stage B: 6-12+(최적: 6)

CFG 스케일을 너무 높이면 스텝 수도 반드시 증가해야 합니다.

6. CFG:

CFG 스케일이 높을수록 이미지의 변동이 줄어들고, 밝아지며, 타오르는 듯한 효과가 생깁니다. 어두운 이미지를 원한다면 CFG 스케일을 낮추세요. 높은 CFG 값에서는 프롬프트의 효과가 두드러집니다.

Stage C: 0.8-18+(최적: 2.5)
Stage B: 1.5로 그대로 두세요.

7. 노이즈 제거 강도:

어떤 이유에서인지 Cascade는 많은 노이즈를 추가하는 경향이 있으므로, 강도 값을 0.1로 유지하는 것이 좋습니다. 더 작은 변화가 필요하면 0.05를, 더 큰 변화가 필요하면 0.2 또는 0.3+를 사용하세요. 우리의 수리 목적에서 최적의 값은 0.1입니다.

8. 가중치:

현재 토큰 가중치는 작동하지 않습니다. (이런 형식:1.0)을 피하세요. 대부분의 경우 타오르는 이미지만 생성됩니다. 가중치를 높이려면 토큰을 프롬프트 시작 부분으로 이동하세요.

9. PAG:

이 유용한 도구는 생성물을 더 디테일에 집중하게 만드는 데 사용되지만, 저는 "적응적 스케일"과 "스케일" 매개변수를 조정하여 동일한 시드의 변형을 추가하는 데 사용합니다.

10. 연락처:

civitai.com/user/Temp 또는 reddit.com/user/-Ellary-에서 저에게 연락하실 수 있습니다.

이제 위로 스크롤하여 워크플로우를 찾고, 데모 프롬프트를 실행하세요. 행운을 빕니다 o/


자주 묻는 질문:


- 어떻게 도와줄 수 있나요?

:Stable Cascade 및 Würstchen 아키텍처에 대해 널리 알려주세요. CivitAI와 Reddit에서 최고의 생성물을 공유하고, 다른 사람들에게 Stable Cascade 사용법을 가르쳐주세요.


- "고해상도 보정 패스" 중 하나가 흐릿한 이미지를 생성합니다!

:"Scale by" 숫자를 조정해보세요. 노이즈가 정렬되어야 합니다.


- 생성된 이미지가 마음에 드는데 너무 어둡습니다!

:"고해상도 보정 패스" 중 하나 또는 둘 모두의 CFG를 높이세요.


- 다양한 모듈을 어떻게 비활성화할 수 있나요?

:"HiRes Fix VAE ENC - R1" 및 "R2" - 고해상도 패스를 비활성화합니다.
"Image Size" - 메인 패스를 비활성화합니다.
"APPLY CN" - Control-Net Canny를 비활성화합니다.
"CLIP-V CON - I1" 및 "I2" - Clip-Vision을 비활성화합니다.


- Img2Img는 어떻게 사용하나요?

:1. 이미지를 "Load Image I1"에 로드하세요.
2. "Upscale Img2Img - to R1"을 "HiRes Fix VAE ENC - R1"에 연결하세요.
3. Img2Img를 사용할 때는 일반적으로 "메인 패스"를 비활성화하는 것이 좋습니다.


- Control-Net Canny는 어떻게 사용하나요?

:1. 이미지를 "Load Image I1"에 로드하세요.
2. "APPLY CN"을 활성화하세요.


- Clip-Vision은 어떻게 사용하나요?

:1. 이미지를 "Load Image I1" 또는 "Load Image I2"에 로드하세요.
2. "CLIP-V CON - I1" 또는 "CLIP-V CON - I2"를 활성화하세요.


- VRAM은 얼마나 필요합니까?

:8GB VRAM, 16GB RAM으로 충분합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.