CounterSushi - Stable Cascade
세부 정보
파일 다운로드
모델 설명
이것은 Stable Cascade(stage_c lite)를 위한 애니메이션 스타일 파인튜닝입니다.
저의 목표는 Stable Cascade에 Counterfeit과 Darksushi와 유사한 스타일을 구현하는 것입니다.
트레이닝은 GitHub의 이 가이드를 따랐습니다.
0.1:
저는 Counterfeit에서 가져온 약 300장의 이미지로 5k 스텝을 트레이닝한 후, 몇 달 전에 제가 만든 커스텀 병합 모델에서 가져온 약 350장의 이미지로 추가로 5k 스텝을 트레이닝했습니다.
v0.2:
약 750장의 더 많은 이미지로 트레이닝했습니다.
더 나은 품질을 위해 권장: compression=32 사용
네거티브:
저품질, 리얼리스틱 — 때로는 이미지 품질을 더 나쁘게 만들고, 때로는 도움이 됨
나쁜 해부학, 비정상적인 형태 — 일반적으로 도움이 됨
포지티브: 트레이닝에 사용한 프롬프트 템플릿을 트리거 단어로 게시했습니다. 하지만 원하는 프롬프트를 아무거나 시도해보세요 (당연하죠)
NSFW: NSFW 이미지를 생성하려 하지 마세요. 약 100장의 NSFW 이미지로 트레이닝했지만 결과가 좋지 않았습니다. 향후 더 추가할 예정입니다.
v0.3:
초기화 후 재트레이닝
지금까지의 실험 설정:
cfg: 2-2.5가 적절해 보임
stage_b는 5스텝, 더 많은 디테일을 원하면 10스텝
네거티브:
cartoon, closeup, lowres, simple background, artifacts, (realism, blurred:1.2)
(아무것도 안 쓰는 것보다는 나을 수 있지만, 다른 네거티브로도 테스트해보세요)
네거티브에 'cartoon'을 포함시키면 이미지에 더 많은 디테일이 추가됩니다.
4k, masterpiece, high quality는 이미지 품질을 향상시키지 않습니다.
compression=42가 좋습니다.
캐릭터를 더 남성스럽게 보이게 하고 싶다면, 네거티브에 '1girl', 'girl'을 넣어보세요. 도움이 될 수 있습니다.
재트레이닝:
1k 장의 1024x1024 이미지로 15k 스텝
650 장의 1024x1792 이미지로 7k 스텝
328 장의 1536x1024 이미지로 5k 스텝
129 장의 1024x1280 이미지로 2.5k 스텝 (트레이닝 시에는 768x로 크기 조정)
따라서 이 모델은 다양한 해상도의 이미지를 생성할 수 있습니다.
마지막 설정의 아이디어는 캐릭터가 전체 이미지에서 상대적으로 작은 비율을 차지하거나 멀리 떨어져 있는 경우, 모델이 이를 어떻게 생성해야 할지 알 수 있도록 하는 것입니다(작은 픽셀 영역에서 캐릭터를 만드는 법을 이미 학습했기 때문). 실제로 효과가 있는지는 잘 모르겠습니다.











