Snakebite
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
이것은 몇 가지 최고의 사실적인 Illustrious 모델과 bigASP 2.5를 결합한 실험적인 체크포인트입니다. 성공했습니다.
왜 중요한가
bigASP는 프롬프트 준수도가 뛰어나지만 스타일과 구성 면에서 극심하게 일관성이 없습니다. 잠재력이 아직 완전히 발휘되지 않은 베이스 모델처럼 느껴집니다. 적절한 설정을 찾는 것은 루빅스 큐브를 풀려는 것처럼 어렵습니다.
반면, Illustrious 모델들은 3D로 전환할 때 많은 개념을 잃어버립니다. 비교적 인기 있는 booru 태그를 사용해도 성공 여부가 불확실합니다. 그러나 이러한 가중치의 조명과 구성은 여전히 👌합니다.
두 모델의 장점을 모두 얻을 수 있을지 시도해보고자 했고, 결과적으로 어느 정도 성공했습니다! 핵심은 신중한 블록 병합입니다. bigASP의 output_blocks.0을 주입하면 그 개념적 지식의 대부분을 얻을 수 있습니다. middle_block.2를 추가하면 해부학적 오류(예: 과도한 팔과 손가락)를 줄일 수 있습니다.
첫 인상
제가 지금까지 본 사실적인 SDXL 모델 중 가장 뛰어난 프롬프트 준수도입니다. 그리고 단지 성적 콘텐츠만을 위한 것이 아닙니다. (하지만 특히 성적 콘텐츠에서는 탁월합니다)
booru 태그와 자연어 모두와 호환됩니다. 혼합 프롬프트 접근법이 가장 좋다고 생각합니다. 저는 프롬프트에서 약 70%는 태그(밑줄 없음), 30%는 자연어를 사용합니다.
_masterpiece quality_나 35mm 같은 bigASP의 스타일 태그를 어느 정도 이해합니다.
완전히 새로운 느낌이 들며 탐색할 가치가 있습니다. bigASP을 무시하지 마세요!
단점
Illustrious 2.0 모델은 해부학적 비율이 심하게 왜곡되지 않으면 1024x1440 또는 1024x1536까지 해상도를 지원합니다(예: longcat형 몸통). 그러나 bigASP의 최적 해상도는 단지 832x1216이며, Snakebite에서는 이 해상도를 초과하지 않는 것이 좋습니다. 초과하면 해부학적 형태는 대체로 괜찮지만(놀랍게도), 이미지 구성은 매우 이상하고 불쾌해집니다.
우리는 새로운 잠재 공간에 들어서 있기 때문에 기존 LoRA는 잘 작동하지 않습니다. 하지만 다시 학습해볼 만한 가치는 있습니다.
권장 설정
Turbo 버전은 추론에 더 적합합니다. 매우 빠르고 미학적 품질이 약간 향상되었습니다. 비-Turbo 버전은 미세 조정에 유용하며, 25단계 이상을 기다리는 데 문제가 없다면 아름다운 텍스처를 생성할 수 있습니다.
Turbo
8 또는 9단계
LCM 샘플러
CFG 1
아래의 커스텀 시그마, 또는 간단히
Full
20에서 28단계
Euler ancestral 샘플러
CFG 3~4
아래의 커스텀 시그마, 또는 간단히
커스텀 시그마 곡선(comfyui-kjnodes를 사용해 적용 가능):
15, 8, 4, 2, 2, 1, 0.4, 0.2, 0
팔다리가 왜곡된다면 시그마 곡선의 처음 몇 값을 조정하면 이미지를 구할 수 있습니다. 다음은 특정 프롬프트에 더 안정적인 버전입니다:
14, 5, 2, 2, 2, 1, 0.4, 0.2, 0
여전히 신체의 기괴한 왜곡이 발생한다면 다음 품질 태그를 시도해보세요(긍정적 프롬프트에 부정적 가중치를 적용하려면 ComfyUI-ppm이 필요합니다):
masterpiece quality, realistic photo, (worst quality,:-1) (mutated,:-1)
Snakebite는 IL 기준으로 스타일 표현에 매우 민감합니다. 불필요한 "장식"은 최소화하세요. 제가 시도한 거의 모든 토큰이 이미지에 큰 영향을 미칩니다.
마지막으로 CLIPAttentionMultiply 노드를 시도해보세요. q와 v 매개변수를 증가시키면 이미지가 더 "Illustrious 스타일"로 변합니다: 더 깨끗하고 안정적이지만, 현실감은 떨어지고(일반적으로) 프롬프트 준수도도 낮아집니다. 두 값을 모두 3으로 설정하면 매우 깨끗한 이미지를 얻을 수 있습니다.
BIGASP의 CLIP이 이제 사용 가능합니다!
버전 1.3 이상부터 Snakebite에는 bigASP의 CLIP이 일부 포함되어 있어 더 다양한 스타일 프롬프트를 활용할 수 있습니다. 어떤 표현이 효과적인지 실험해보세요. 저의 경우 간단하게 유지합니다. 이는 부작용 없이 일반적으로 이미지 품질을 향상시킵니다:
high quality, sharp focus
어떤 버전이 나에게 맞을까?
어떤 모델 버전을 사용해야 할지 고민된다면, 요약하면:
v1.4 = 다음 세대의 현실감, 압도적인 텍스처, 매우 안정적, 이전 버전보다 색상이 약간 덜 생생하며 비사진적 이미지 생성 능력이 낮음
v1.3 = 좋은 해부학, 좋은 배경, 좋은 일관성
v1.2 = 가장 강렬한 색상
v1.1 = CLIP을 제외하고 bigASP의 영향이 가장 큼, 색상이 어두움, 솔직히 실패한 실험
v1.0 = 인상적인 창의성과 함께 매우 불안정
이 모델을 좋아하시거나 더 미세 조정에 사용하셨다면, 꼭 알려주세요! 결과를 보고 싶습니다. 💪


