Influx

세부 정보

파일 다운로드

모델 설명

제가 커스텀 트레이닝한 SD15 모델에 오신 것을 환영합니다.

이 모델은 약 6,000장의 플럭스 생성 이미지를 사용하여 다양한 스타일을 실험하며(많은 시도와 오류를 거쳐) 트레이닝되었습니다.

데이터셋 출처:

/model/631007?modelVersionId=705402

자동 캡션 생성을 위해 _pharmapsychotic -> clip_interrogator_에 의존했기 때문에, 엄격한 태그나 설명은 존재하지 않으며, 그냥 즐겁고 탐색적인 접근 방식을 사용했습니다.

저는 이전에 기계 학습 경험 없이 단순히 취미로 이 작업을 하고 있습니다.

수많은 실험, _onetrainer_를 사용하며 보낸 수많은 시간, 그리고 낭비된 에너지들 사이에서 정말로 흥미로운 모험 이었습니다. 하지만 여전히 배워야 할 것이 많고, 이 모델을 더 발전시키는 데 기대하고 있습니다.

현재 이 모델에서 얼굴은 좋지 않거나 잘 모르겠네요. 아마도 좋은 프롬프터분들이 저에게 알려주실 수 있을 것입니다. 더 많이 배워야 합니다. ComfyUI의 한 가지 설정이 "더 나은 프롬프트" 생성에 매우 큰 도움이 되었습니다.

이미지 품질을 향상시키려면 512x512에서 768x768로 HiRes 스케일링을 사용하는 것이 가장 좋습니다.

트레이닝 설정:

음,

트레이닝 설정

  • 에포크: 100

  • 배치 크기: 초기 트레이닝 시 10 -> 32

  • 그래디언트 누적 단계: 1

  • 학습률: 1e-05

  • 가중치 데이터 타입: FLOAT_16

  • 출력 데이터 타입: FLOAT_16

  • 스케줄러: CONSTANT

  • 트레이닝 디바이스: cuda

  • 트레이닝 데이터 타입: BFLOAT_16 (Fallback: FLOAT_32)

  • 어텐션 메커니즘: SDP

  • 해상도: 512

검증 및 샘플링

  • 검증 활성화: true

  • 검증 간격: 1 (에포크)

  • 샘플링 간격: 200 (스텝)

  • 샘플 이미지 형식: PNG

최적화기

  • 최적화기: ADAMW_8BIT

  • 가중치 감쇠: 0.01

  • Beta1: 0.9

  • Beta2: 0.999

  • 8비트 블록 단위: true

  • 확률적 반올림: true

초기에는 1e-5로 트레이닝을 시작했고, 이후 5e-5로 줄였습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.