CounterSushi - Stable Cascade

세부 정보

파일 다운로드

모델 설명

이것은 Stable Cascade(stage_c lite)를 위한 애니메이션 스타일 파인튜닝입니다.

저의 목표는 Stable Cascade에 Counterfeit과 Darksushi와 유사한 스타일을 구현하는 것입니다.

트레이닝은 GitHub의 이 가이드를 따랐습니다.

0.1:

저는 Counterfeit에서 가져온 약 300장의 이미지로 5k 스텝을 트레이닝한 후, 몇 달 전에 제가 만든 커스텀 병합 모델에서 가져온 약 350장의 이미지로 추가로 5k 스텝을 트레이닝했습니다.

v0.2:

약 750장의 더 많은 이미지로 트레이닝했습니다.

더 나은 품질을 위해 권장: compression=32 사용

네거티브:

저품질, 리얼리스틱 — 때로는 이미지 품질을 더 나쁘게 만들고, 때로는 도움이 됨

나쁜 해부학, 비정상적인 형태 — 일반적으로 도움이 됨

포지티브: 트레이닝에 사용한 프롬프트 템플릿을 트리거 단어로 게시했습니다. 하지만 원하는 프롬프트를 아무거나 시도해보세요 (당연하죠)

NSFW: NSFW 이미지를 생성하려 하지 마세요. 약 100장의 NSFW 이미지로 트레이닝했지만 결과가 좋지 않았습니다. 향후 더 추가할 예정입니다.

v0.3:

초기화 후 재트레이닝

지금까지의 실험 설정:

cfg: 2-2.5가 적절해 보임

stage_b는 5스텝, 더 많은 디테일을 원하면 10스텝

네거티브:

cartoon, closeup, lowres, simple background, artifacts, (realism, blurred:1.2)

(아무것도 안 쓰는 것보다는 나을 수 있지만, 다른 네거티브로도 테스트해보세요)

네거티브에 'cartoon'을 포함시키면 이미지에 더 많은 디테일이 추가됩니다.

4k, masterpiece, high quality는 이미지 품질을 향상시키지 않습니다.

compression=42가 좋습니다.

캐릭터를 더 남성스럽게 보이게 하고 싶다면, 네거티브에 '1girl', 'girl'을 넣어보세요. 도움이 될 수 있습니다.

재트레이닝:

1k 장의 1024x1024 이미지로 15k 스텝

650 장의 1024x1792 이미지로 7k 스텝

328 장의 1536x1024 이미지로 5k 스텝

129 장의 1024x1280 이미지로 2.5k 스텝 (트레이닝 시에는 768x로 크기 조정)

따라서 이 모델은 다양한 해상도의 이미지를 생성할 수 있습니다.

마지막 설정의 아이디어는 캐릭터가 전체 이미지에서 상대적으로 작은 비율을 차지하거나 멀리 떨어져 있는 경우, 모델이 이를 어떻게 생성해야 할지 알 수 있도록 하는 것입니다(작은 픽셀 영역에서 캐릭터를 만드는 법을 이미 학습했기 때문). 실제로 효과가 있는지는 잘 모르겠습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.