Initium | Finetune | NoobAI Epsilon 1.1
세부 정보
파일 다운로드
모델 설명
Initium (SDXL, IllustriousXL): Initium이란?
- Noobai V1.1을 기반으로 구성되었으며, NoobAI 1.1의 남아 있는 일부 문제를 "수정"하는 데 도움이 되도록 설계된 모델입니다. 이 모델은 자체 머지 생성을 위한 기반으로 사용되며, 특히 이 모델과 공유된 계보를 가진 머지의 학습 기반으로 최적화되었습니다.
특징:
맞춤 학습된 텍스트 인코더: 고유한 CLIP/TENC 학습 및 이에 맞춘 U-net 정렬을 포함합니다.
데이터셋: ~~22만 장의 이미지 데이터셋(lucereron + Initium v1 데이터셋 + 신규 데이터)으로 학습되었습니다. 데이터셋은 단순히 1girl에만 집중되지 않았으며, 다양한 풍경, 추상적 요소, 인물이 없는 이미지를 생성하도록 설계되었습니다. 여성 캐릭터에 대한 편향은 다소 낮아졌으며, 이 목록의 아티스트들이 학습에 포함되었습니다. 예를 들어, sen \(astronomy\)와 같은 이스케이프 문자를 사용해야 합니다. 많은 아티스트의 샘플은 다음 링크에서 확인 가능합니다: https://files.catbox.moe/9lglyd.png, https://files.catbox.moe/4earj9.png, https://files.catbox.moe/b5egkz.png, https://files.catbox.moe/timjci.png, https://files.catbox.moe/8jni63.png, https://files.catbox.moe/c0zd98.png, https://files.catbox.moe/gw1v45.png, https://files.catbox.moe/9lyidu.png. 향후 v3 버전은 대부분의 서명을 제거하는 데 초점을 맞춰 개발될 예정입니다.
LoRA: Illust 0.1에서 학습된 LoRA는 맞춤형 TENC 때문에 작동하지 않을 수 있으니, NoobAI 1.0/1.1 또는 이 모델 자체에서 직접 학습된 LoRA를 사용하세요.
태그 기반 손실 스케일링: 과적합을 방지하기 위해 NAI v3의 구현을 모방했습니다. 데이터셋 내에서 태그가 과도하게 나타나면 해당 태그의 손실은 감소하고, 극히 드물게 등장하는 태그의 손실은 증가합니다.
사용 팁:
긍정적 프롬프트:
masterpiece, best quality부정적 프롬프트:
low quality, bad hands, greyscale, bad anatomy선택적 부정적 프롬프트:
signature, 4koma, multiple views, watermark, patreon logoSchizo 부정적 프롬프트: worst quality, low quality, worst aesthetic, old, early, blurry, lowres, signature, artist name, watermark, twitter username, sketch, logo, furry, text, speech bubble, censored
스타일링:
필요에 따라
realistic/3d태그를 사용하고, 부정적 프롬프트를 조정하여 모델이 원하는 스타일로 유도하세요.위의 아티스트 목록에 포함된 아티스트를 사용하세요. 이들은 학습 과정에서 정규화에 사용되었으며, 다른 데이터셋에서의 지식 소실 없이 유지되었습니다. 모든 콘텐츠에 대해 20 에포크 이후 데이터셋이 축소되었으며, 원래 22만 장의 이미지에서 4만 장의 선별된 이미지로 줄어들었습니다.
기술 설정:
샘플러: Euler a, Euler
스텝: 20-28
CFG 스케일: 5.0-8.0
해상도: 1024x1024 또는 ~~1,048,576 픽셀 이하의 모든 비율
모델 레시피:
- 맞춤형 CLIP/TENC 설정 및 U-net 정렬로 개발되었습니다.
호환성:
- ComfyUI에서의 어텐션 컷 기능을 사용하여 Noobai v1.1과 동기화하면 최적의 결과를 얻을 수 있으며, 이는 PotatCat이 안내했습니다.
감사 인사:
- Arc En Ciel 디스코드 서버, @mfcg , @FallenIncursio , @Anzhc, @richyrich515 및 기타 모든 지원자들에게 감사드립니다!
재미를 위한 면책 조항: 이 모델을 사용함으로써 귀하는 자신의 가상의 볼 하나를 @novowels 에게 기부하는 데 동의하는 것입니다.
최상의 결과를 얻으려면 재변환 설정에서 위 항목을 반드시 적용하세요.

SDXL 모델에는 Emphasis mode No Norm을 권장합니다.

저를 지원하고 싶다면, 이 모델을 좋아해 주시거나, Buzz를 기부하거나, 제 Ko-fi에 기부해 주세요. 이 모델은 8xL40S로 미세 조정되었습니다.
관련 학습 정보:
최소 22만 장의 이미지로 학습되었습니다.
40 에포크 동안 배치 처리를 통해 약 ~~450만 개의 실제 스텝이 수행되었습니다.
유효 배치 크기는 15 x 8 GPU x 6 그래디언트 누적(RTX Ada 6000 x8)이었습니다.
학습률은 Compass를 사용하여 6e-6, 이후 AdamW로 1.5e-5를 사용했으며, Clip L은 5e-7, Clip G는 Adabelief로 4e-7에 학습되었습니다.




















