vae-teding-aliased-2024-03

세부 정보

모델 설명

https://huggingface.co/thomaseding/vae-teding-aliased-2024-03

(이 VAE를 제 PixelNet 모델과 함께 사용하려면, 너비와 높이가 모두 8의 배수인 체커무늬를 사용하세요.)

별표: 이 VAE는 디코더 출력을 별표화하여 더 나은 픽셀 아트 생성을 위해 Stable Diffusion 1.5를 미세 조정한 디코더입니다. 이 VAE의 품질은 픽셀 아트 모델이 8의 배수 크기의 '타일'로 학습되었을 때 최적화됩니다. 그렇지 않으면 이어선과 같은 아티팩트가 발생합니다.

미세 조정은 5만 장의 이미지를 1에포크 동안, 효과적인 배치 크기 12로 학습하여 수행되었습니다. 저는 각 8x8 타일을 평균 색상으로 양자화하도록 이미지를 사전 처리했습니다. RTX3090에서 이 미세 조정에는 약 4시간이 소요되었습니다. 학습률 1e-5에서 MSE 손실만 사용했습니다. 학습 데이터셋은 주로 만화 스타일의 이미지로 구성된 다른 Stable Diffusion 모델에서 생성되었습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.