Kohaku XL 베타

150만 장의 이미지로 학습된 애니메이션 SDXL 모델.

참고: 추가 실험 결과, beta7이 beta7pro보다 일반적으로 더 나은 성능을 보였습니다. beta7pro는 모자이크 아티팩트가 더 두드러지며, beta7은 텍스트-이미지 정렬이 더 우수합니다. 따라서 모델 순서를 재정렬했습니다.

개요

이 모델은 [Kohaku-XL 알파](Kohaku-XL 알파 - nyan | Stable Diffusion 체크포인트 | Civitai)를 150만 장의 이미지로 재학습한 후, 다른 모델들과 병합하여 개발되었습니다.

사용 설명

이 모델은 해상도에 매우 유연하며, sd1.x/2.x에서 사용하던 해상도(예: 512x768)로도 정상적인 결과를 얻을 수 있으며, SDXL에 더 적합한 해상도(예: 896*1280) 또는 더 큰 해상도(1024x1536도 텍스트-이미지 생성에 적합)를 사용할 수 있습니다.

애니메이션 스타일에 권장되는 부정 프롬프트:

photorealistic, 3d model, bad, worse, worst, ugly, bad anatomy, blurry, close-up, disembodied limb
photorealistic, text, icon, artist name, signature, twitter username, naked, nude, monochrome, blurry, bad anatomy, watercolor, oil painting
watercolor, oil painting, photo, deformed, realism, disfigured, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

학습 세부 정보

Kohaku-XL beta5

이 모델은 148만 장의 이미지를 포함하는 new-danbooru(Danbooru 이미지, ID 5,000,000~6,600,000)에서 학습되었습니다.
이 모델은 Kohaku-XL alpha7에서 재개하여 NekoRayXL과 병합되었습니다.

Kohaku-XL base4(아직 공개되지 않음)

이 모델은 148만 장의 이미지를 포함하는 new-danbooru(Danbooru 이미지, ID 5,000,000~6,600,000)에서 학습되었습니다.
이 모델은 SDXL-0.9에서 재개되었습니다(SDXL-1.0의 일부 문제 특성으로 인해 미세 조정에 영향을 줄 수 있음). 계획상 이 모델은 2에포크(약 94.5k 스텝)로 학습될 예정입니다.

이 미리 학습된 모델은 아직 공개하지 않았습니다.

Kohaku-XL beta7

이 모델은 base4와 beta5를 병합하여 만들었으며, 공식은 다음과 같습니다:

beta(5+n) = beta5 + (n/4) * (base4 - sdxl0.9)

따라서 beta7은 beta5 + 0.5 * (base4 - sdxl0.9)입니다.

Kohaku-XL beta7.1(7pro)

beta7과 동일하나, 완성된 base4와 0.25 가중치를 사용합니다.

참고: 여기서 사용된 base4는 50k 스텝 버전입니다!!

향후 계획

base4 학습이 완료된 후, Mynefactory 데이터셋 또는 CyberMeow(alea31415)/Narugo1992의 reg 데이터셋에서 추가 학습을 진행할 예정입니다.

감사의 말씀

모델

NekoRayXL

모델 유형	체크포인트
기본 모델	SDXL 1.0
게시일	10/21/2023

Kohaku-XL beta

세부 정보

파일 다운로드

이 버전에 대해

모델 설명