데이터셋: 캐릭터 생성 스크린샷 도구를 사용하여 게임 내에서 촬영한 121장의 이미지
모델 INZOIV1A 요약:
- 베이스 모델: Stable Diffusion v1-5
- LoRA 유형: 표준, LyCORIS 프리셋(전체)
- 정밀도: fp16
- 최적화기: Adafactor, SNR 스케줄을 사용한 허버 손실
- 해상도: 768x768, 256–2048 범위에서 버킷화
- 학습:
- 에포크: 8, 4번마다 샘플링
- 데이터셋 내 121장의 이미지
- 배치 크기: 3, 그래디언트 누적: 1
- 학습률: 0.0001 (UNet 및 텍스트 인코더)
- 적응형 노이즈: Multires 노이즈 할인 0.3; 원본 노이즈 오프셋
- 출력:
- 형식: bf16 safetensors
- 샘플링: Euler-A, 프롬프트 "inzoi style, a man" 및 "inzoi style, a woman"