이것은 크기가 매우 큰 384 차원 LoRA이며, 적응형 학습률 실험 중입니다.
참고 저는 kohya_ss 도구를 사용하여 이 LoRA를 낮은 차원으로 리사이징해보았지만, 결과 품질이 너무 주관적였습니다 (일부 이미지는 품질이 저하되었고, 일부는 향상되었습니다).
학습 설정
3137장의 학습 이미지
512x512 학습 해상도
16 에포크, 6,384 스텝, 8 배치
네트워크 차원 및 알파 값 384
DAdaptAdam 옵티마이저, 일정 스케줄러
학습률 1.0
버킷팅 및 랜덤 컷
유용한 선택적 토큰들
urushisato – 모든 이미지에 일반적인 스타일 강화를 위해 태깅
ova – 애니메이션 화면 캡처 이미지에 모두 태깅
background – 인물이 없는 모든 이미지에 태깅
플럭스 버전 추가됨
1980년대 후반~1990년대 초반 애니메이션 감성에 어울리는 스타일
우루이시하라 사토시의 작품과 OVA 스틸 이미지로 학습됨.