[SD1.5] ColorSplash - V-prediction Vibrant Anime Mix

세부 정보

모델 설명

경고: 여기에는 용이 있다!

이 모델의 CLIP은 Model Toolkit과 호환되지 않습니다. 이 모델을 점검하거나 정리할 때 Model Toolkit을 절대 사용하지 마세요. 그렇지 않으면 모델 자체가 파괴됩니다. 자세한 정보는 이 기사 를 참고하세요.

또한, 이 모델은 zSNR 및 V-예측을 사용합니다. .yaml 구성 파일을 다운로드하여 모델과 같은 폴더에 저장하세요(A1111/Forge용); 또는 ComfyUI의 ModelDiscreteSampling 노드를 사용하세요.

이 모델은 무엇인가요?

ColorSplash(이전에는 프리뷰 이미지에서 ColorStorm이라는 이름으로 불렸으며, 이제 더 나은 성능을 위해 재작성됨)는 v-예측을 통합하더라도 품질이 크게 저하되지 않는지 테스트하기 위해 제작된 Stable Diffusion 1.5 병합 모델입니다. 저는 이를 계속 개선해 나가고 있는 중입니다.

이 모델을 어떻게 사용하나요?

프롬프트 작성:

이 모델(제 테스트 기준)은 booru 태그를 매우 잘 활용하지만, 자연어는 거의 사용하지 못합니다.

스타일을 이 모델로 조절하는 것은 어렵습니다. 프롬프트 단어 수가 적을 때 모델은 깨끗하고 선명하지만, 단어가 많아질수록 왜곡이 심해집니다. 이 문제를 해결하기 위해 고해상도 보정(Hi.res fix)을 강력히 권장합니다.

대부분의 애니메이션 체크포인트와 마찬가지로, 이 모델도 여성 캐릭터에 편향되어 있지만, 이는 보완할 수 있습니다.

이 모델은 주로 ComfyUI의 프롬프트 파서와 reForge의 기본 파서(.yaml 구성 파일 사용)로 테스트되었습니다.

인기 있는 캐릭터는 인식이 잘 되지만, 그 외의 캐릭터는 잘 인식되지 않습니다. 9th Tail의 캐릭터 학습은 약화되었지만 완전히 사라지지 않았습니다. ConcoctionMix의 Hololive 및 AIOMonsterGirl 사용도 약간 약화되었지만 완전히 사라지지 않았습니다. 참고: Suzuran의 여러 꼬리는 희미하게 나타날 수 있습니다.

이 모델은 퓨리 콘텐츠 생성에도 놀랍도록 잘 작동합니다. 왜 그런지는 정확히 모르겠습니다...

또한, 병합된 지식을 접근할 때 "갈색 빛 오류(brown-outs)"가 발생합니다(대부분의 경우 이미지가 갈색으로 물들어 나타남). 따라서 주의하세요.

매개변수:

(굵게 표시된 항목은 테스트하여 잘 작동함)

  • 샘플러 + 스케줄러: 거의 모든 것들이 작동하지만 일부 갈색 빛 현상이 발생합니다. 최선의 해결책은 **Euler beta, DPM++ 2M beta**이며, 보조 추천은: Euler a, DPM++ 2M SGM Uniform, DPM Adaptive, UniPC simple, DDIM (ddim_uniform 사용), DPM++ SDE Beta입니다. Karras 스케줄러는 완전히 사용 불가합니다. 이것은 v-예측 모델의 유일한 문제일 가능성이 높습니다.

  • 스텝: 20+

  • CFG: 4–12 (권장 범위: 4–6, 7–12는 사용 가능하지만 아티팩트 발생), RescaleCFG 권장

  • CLIP Skip: 1-2

  • 해상도: 3:2 비율 테스트 완료, 기본 해상도 768 이하(640, 512) 사용 가능.

  • 고해상도 보정(Hi.res fix): 강력히 권장. 1.5x 잠재 공간 업스케일로 테스트 완료.

병합 레시피:

ColorSplash-v0.1

이 이미지는 ComfyUI 형식으로 ColorSplash-v0.1 병합 레시피의 전체 내용을 보여줍니다. comfy-mecha 및 ComfyUI-DareMerge[적절히 사용되지 않음]를 사용합니다. 메타데이터는 이미지 내부에 포함되어 있습니다.

간단한 TIES 병합(k=0.9)이며, 다음과 같은 모델을 사용합니다:

  • 모델 A: 9th Tail - main_v0.3

  • 모델 B: ConcoctionMix-a1 [Vodka]

  • 모델 C: ConcoctionMix-a2 [Vermouth]

ColorSplash-v0.1.1

V0.1.1은 CLIP을 전혀 수정할 필요 없어 comfy-mecha만 사용합니다.

이미지를 읽지 못하는 분들을 위해 설명하자면, 4개의 모델을 사용한 2단계 병합입니다:

  • 모델 A: ColorSplash - v0.1 (초기에 ConcoctionMix 실험용으로 계획됨)

  • 모델 B: AIOMonsterGirl - v4 (더 일관된 지식 전달)

  • 모델 C: OpenSolera - a6 [Fleur] (동일한 아이디어)

  • 모델 D: FluffyRock Unleashed - v1.0 Base (동일한 아이디어)

1단계: A-x-A 방식으로 차이를 학습합니다. 여기서 x는 모델 B, C, 또는 D입니다.

2단계: 드롭아웃을 적용한 TIES 합산(k=1)을 수행한 후, 이를 모델 A에 다시 더합니다.

ColorSplash-v0.1.2

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.