매우 중요: 이 모델을 AUTOMATIC1111과 함께 사용하려면, 모델 파일과 함께 구성 파일(config file)도 다운로드하여 모델 폴더에 넣어 주세요. 향후 automatic1111의 2.x 버전 지원이 더 발달함에 따라 이 조건이 바뀔 수 있습니다.
이 모델은 Stable Diffusion 1.4가 아니라 2.1 버전의 파인튜닝 버전이며, 생성되는 결과물이 훨씬 더 흥미롭습니다. 어떻게 프롬프트를 작성해야 하는지 예시 이미지의 'i' 아이콘을 클릭하여 확인하세요 (음성 프롬프트가 여기서 특히 중요합니다). 마음이 맞는다면 실험해보고 리뷰에 흥미로운 발견을 공유해 주세요.
라이선스: 저는 모델이 저작권 보호 대상이 되어야 한다고 믿지 않습니다. 따라서 이 모델을 사용해 원하는 어떤 작업(업로드, 재배포, 추가 파인튜닝, 베리믹스 등)을 해도 괜찮습니다. 다만 여러분이 이 모델을 기반으로 만든 모델을 공유해 주셨으면 합니다. 하지만 그렇게 하지 않으셔도 전혀 상관없습니다.
이 모델은 약 250개의 수동으로 캡션을 붙인 이미지 데이터셋으로 StableTuner를 사용해 파인튜닝되었습니다. 학습률은 1e-6, 에포크 수는 250, 배치 크기는 24입니다. 텍스트 학습을 75 에포크까지만 진행하여 과적합을 방지했습니다.
참고: 우연히 이 모델이 뛰어난 비아이콘형 예술(Non-icon art) 작업을 할 수 있다는 것을 발견했습니다. 시네마틱한 도시 풍경 이미지를 보면, 다른 방식으로 프롬프트를 구성해 보는 방법을 알 수 있습니다.