Stabilizer IL/NAI
세부 정보
파일 다운로드
모델 설명
표지 이미지는 사전 학습된 모델에서 원본 출력으로, 1MP 해상도로 생성됩니다. 보이는 그대로입니다. 업스케일도 없고, 손/얼굴 인페인팅 수정도 없으며, 심지어 네거티브 프롬프트조차 없습니다.
(2025년 10월 21일): 앞으로 나아갈 시간입니다...
이 모델은 더 이상 적극적으로 업데이트되지 않습니다. SDXL은 너무나... 오래되었습니다. 2년 전(2023년 6월)에 출시된 모델이죠.
새로운 모델을 시도해보세요. 이들은 더 최신 아키텍처, 더 나은 성능, 훨씬 더 높은 효율성을 가지고 있습니다. 예를 들어: Lumina 2. Lumina 2를 처음 듣는 분들을 위해 간단한 정보:
2025년 1월 출시. 오픈소스. Apache License 2.0.
DiT 아키텍처(현재 가장 인기 있는 아키텍처. Flux.1과 동일한 구조).
작고 효율적. 단 2B 매개변수. 전체(fp16) 모델은 5GB, Q8 모델은 단 2.5GB로, 품질을 잃지 않고 GTX 1050에서도 로드하고 실행할 수 있습니다.
동일한 Flux 16ch VAE 사용. 수학적으로 SDXL의 4ch VAE보다 4배 더 우수.
Google Gemma 2 2b를 텍스트 인코더로 사용(네, 완전히 기능하는 챗 LLM입니다). SDXL의 오래된 CLIP보다 10배 더 우수합니다. CLIP은 태그만 이해할 수 있지만, 이 모델은 거의 모든 것을 이해합니다... 영어, 중국어, 일본어, 오타, 구어체, 시까지. 예: 다음과 같이 프롬프트만으로도 가능합니다. (참고: 이는 네 장의 이미지가 아니라 하나의 이미지입니다. 전체 이미지와 프롬프트는 여기에서 확인하세요. 아이디어는 여기에서 유래했습니다.)

저는 "향상 버전 패키지" LoRA를 훈련했습니다. 이름이 변경되어 오해가 줄어들었으며, 데이터셋은 동일합니다.
또한, Civitai가 Lumina 2를 지원하지 않을 것이라 생각합니다. 저도 이 모델을 TensorArt에 업로드했습니다. 여기에서 저를 찾을 수 있습니다. 로컬 설정이 없으시면 온라인에서 Lumina 2 모델을 사용해보세요.
유용한 링크:
모델:
Neta Lumina: 베이스 모델. danbooru 및 e621 데이터셋으로 훈련된 애니메이션 스타일 세부 조정 모델.
NetaYume Lumina: 베이스 모델. 최신 데이터셋으로 추가 세부 조정.
최적화:
하드웨어 가속: 최신 GPU(RTX 3xxx 이상)에 torch.compile 사용 시 30% 빠름. bf16을 지원하지 않는 이전 GPU(RTX 2xxx 이하)에서는 fp16 모드를 활성화하면 3배 빠르며, 기본적으로 이전 GPU는 fp32를 사용하여 매우 느립니다. https://civitai.com/articles/22251
TeaCache: https://github.com/spawner1145/CUI-Lumina2-TeaCache
Lightning LoRA, 2배 빠름(실험적): /model/2115586
스케일된 fp8 베이스 모델(DiT+TE), 단 3GB: /model/2023440
Stabilizer
무엇인가요?
7,000장의 이미지로 중간 규모 세부 조정된 모델입니다.
클로즈업 의복, 손, 복잡한 조명, 전통 예술 등 다양한 특화된 하위 데이터셋 포함.
자연스러운 텍스처, 조명, 최고의 세부 사항만 포함. 플라스틱처럼 광택 있는 AI 스타일은 없습니다. 데이터셋에 AI 생성 이미지가 하나도 없기 때문입니다. 모든 이미지를 제가 직접 선별했습니다. AI 이미지로 훈련하는 것은 싫습니다. 이는 '전화 게임'처럼 AI 이미지로 AI를 훈련하면 정보가 점점 소실되어 더 나빠지기 때문입니다(플라스틱, 광택).
프롬프트 이해력 향상. 자연어 캡션으로 훈련되었습니다.
고정된 스타일보다 창의성에 중점을 둠. 데이터셋이 매우 다양합니다. 따라서 이 모델은 창의성을 제한하는 기본 스타일(편향)이 없습니다.
(v-pred) 더 나은 균형 잡힌 조명. 과도한 밝기나 채도가 없습니다. 동일한 이미지 내에서 순수한 검정(0)과 흰색(255)을 원하십니까? 문제없습니다.
왜 기본 스타일이 없나요?
"기본 스타일"이란: 모델에 기본 스타일(편향)이 있다면, 어떤 프롬프트를 입력하든 항상 같은 요소(얼굴, 배경, 감정)를 생성한다는 뜻입니다.
장점: 사용하기 쉽습니다. 스타일을 프롬프트로 지정할 필요가 없습니다.
단점: 그러나 그것도 덮어쓸 수 없습니다. 기본 스타일에 맞지 않는 프롬프트를 입력하면 모델은 무시합니다. 여러 스타일을 중첩해도, 기본 스타일이 항상 다른 스타일을 덮고 오염하며 제한합니다.
"기본 스타일 없음"은 편향이 없다는 뜻이며, 당신이 원하는 스타일을 태그나 LoRA로 명시해야 모델이 안내됩니다. 하지만 이 모델에서는 스타일의 중첩/오염이 발생하지 않습니다. 중첩한 스타일을 정확히 원하는 대로 얻을 수 있습니다.
효과:
이제 모델은 단순화된 애니메이션 이미지가 아니라, 프롬프트로 지정한 스타일을 정확히 생성합니다. 스타일 중첩/이동 없음, AI 얼굴 없음, 오직 더 나은 세부 사항만 있습니다. 비교:
https://civitai.com/images/84145167 (일반 스타일)
https://civitai.com/images/84256995 (아티스트 스타일, 얼굴에 주목하세요)
"스타일 이동 및 AI 얼굴"이 무엇인지 알고 싶다면:
다른 모델: https://civitai.com/images/107647042. 여성의 얼굴과 끔찍한 광택 있는 배경.
표지 이미지에서 더 많은 xy 플롯을 확인하세요. xy 플롯은 천 마디 말보다 더 많은 정보를 담고 있습니다.
왜 이 "세부 조정된 베이스 모델"이 LoRA인가요?
저는 거대한 챔피언이 아니며, 수백만 장의 훈련 이미지를 가지고 있지 않습니다. 전체 베이스 모델을 세부 조정할 필요가 없습니다. LoRA로 충분합니다.
저는 단지 업로드하고, 여러분은 tiny 40MiB 파일만 다운로드하면 됩니다. 7GiB의 거대한 체크포인트 대신입니다. 이는 99.4%의 데이터 및 저장 공간을 절약합니다. 그래서 자주 업데이트할 수 있습니다.
이 LoRA는 작아 보일 수 있지만, 여전히 강력합니다. 왜냐하면 NVIDIA의 새로운 아키텍처인 DoRA를 사용하기 때문입니다. 이는 기존 LoRA보다 효율적입니다.
그럼 이 "세부 조정된 베이스 모델"을 어떻게 얻나요?
사전 학습된 베이스 모델에 이 LoRA를 완전한 강도로 적용하세요. 그러면 사전 학습된 베이스 모델이 세부 조정된 베이스 모델이 됩니다. 아래 "사용 방법" 참조.
이 모델을 사용한 병합 공유는 금지됩니다. 참고로, 숨겨진 트리거 단어가 있어 투명한 워터마크를 출력합니다. 저는 워터마크와 탐지기를 직접 코딩했습니다. 사용하고 싶지 않지만, 가능합니다.
이 모델은 Civitai 및 TensorArt에만 게시되었습니다. 다른 플랫폼에서 "me"와 이 문장을 본다면, 모두 사기이며 사용 중인 플랫폼은 해적 플랫폼입니다.
피드백은 댓글 섹션에 남겨주세요. 그러면 모두가 볼 수 있습니다. Civitai 리뷰 시스템에는 피드백을 쓰지 마세요. 디자인이 너무나 잘못되어, 실제로 아무도 리뷰를 찾거나 볼 수 없습니다.
사용 방법
버전:
nbvp10 (NoobAI v-pred v1.0용).
- 정확한 색상과 선명한 세부 사항.
nbep10 (NoobAI eps v1.0용).
- v-pred 모델에 비해 채도와 대비가 낮습니다. 표준 엡실론(eps) 예측은 모델이 더 넓은 색상 범위에 도달하는 것을 제한합니다. 그래서 이후에 v-pred이 등장했습니다.
illus01 (Illustrious v0.1로 훈련되었지만, 여전히 NoobAI eps v1.0을 권장).
- 이 모델을 다른 세부 조정된 베이스 모델 위에 적용하려는 경우, 현재 대부분의 "Illustrious"라고 표시된 애니메이션 베이스 모델은 사실 NoobAI(또는 주로 NoobAI)임을 주의하세요. 두 버전(il01 및 nbep10)을 모두 시도해보고 어떤 것이 더 나은지 확인하는 것이 좋습니다.
LoRA 스택에서 이 LoRA를 먼저 로드하세요.
이 LoRA는 NVIDIA의 새로운 아키텍처인 DoRA를 사용해 기존 LoRA보다 효율적입니다. 그러나 기존 LoRA가 정적 패치 가중치를 사용하는 것과 달리, DoRA의 패치 가중치는 현재 로드된 베이스 모델의 가중치에 기반해 동적으로 계산됩니다(LoRA를 로드할 때 변경됨). 예상치 못한 변화를 최소화하기 위해 이 LoRA를 먼저 로드하세요.
이 모델을 사용하는 두 가지 방법:
1) 세부 조정된 베이스 모델로 사용 (권장):
최고의 자연스러운 세부 사항을 원하고, 원하는 스타일 조합을 완전히 제어하고 싶은 경우.
LoRA를 사전 학습된 베이스 모델 위에 적용하세요. 참고: 사전 학습된 모델은 원본 모델, 즉 세부 조정되지 않은 모델을 의미합니다. 예: NoobAI v-pred v1.0, NoobAI eps v1.0
2) 다른 세부 조정된 베이스 모델 위의 LoRA로 사용:
어쨌든 LoRA이기 때문입니다.
그러나 주의하세요:
이것은 스타일 LoRA가 아닙니다. 사실 두 베이스 모델을 병합하는 것입니다. 결과가 항상 원하는 대로 나오지는 않습니다.
하이퍼 병합된 AI 스타일 오염된 1girl 과적합 50가지 노바 퓨리 3D 애니메이션 WAI 등에는 작동하지 않습니다. 이 모델은 그러한 광택 있는 플라스틱 AI 스타일을 해결할 수 없습니다. AI 스타일을 제거하려면 사전 학습된 베이스 모델을 사용하세요.
이것은 애니메이션을 본 적 있다면, Craft Lawrence(스파이스 앤 워프)가 실제로 있어야 할 모습입니다: https://civitai.com/images/107381516
이것은 AI 스타일 오염된 1girl 과적합 모델이 생성한 모습입니다: https://civitai.com/images/107647042
자주 묻는 질문:
표지 이미지는 원본으로 사전 학습된 모델에서 생성된 1MP 해상도의 출력입니다. 마법 같은 플러그인도 없고, 업스케일도 없고, 손/얼굴 인페인팅 수정도 없으며, 심지어 네거티브 프롬프트도 없습니다. 일부 사용자가 재현할 수 없다고 말하는데, 이는 기술 문제입니다. (잘못된 베이스 모델 사용 또는 과도한 "최적화" 추가)
낮은 강도(예: <0.5)에서도 베이스 모델이 망가진다면,那是 베이스 모델의 문제입니다. 베이스 모델에 이미 이 LoRA가 병합되어 있고(그리고 두 번 병합했기 때문에), 모델 가중치가 곱해져 붕괴된 것입니다. 가짜 베이스 모델 제작자(도둑)에게 주의하세요. 일부 "제작자"는 훈련을 하지 않고, 타인의 모델을 가져와 병합하고, 모든 메타데이터와 크레딧을 삭제한 뒤, 자신의 베이스 모델로 판매합니다.

기타 도구
Stabilizer의 일부가 되려고 했거나, 이전에 포함되었던 몇 가지 아이디어들이 이제 분리된 LoRA로 독립되었습니다. 더 나은 유연성을 위해. 모음집 링크: https://civitai.com/collections/8274233.
Dark: 어두운 환경에 편향된 LoRA. 일부 베이스 모델의 높은 밝기 편향을 수정하는 데 유용합니다. 낮은 밝기 이미지로 훈련되었습니다. 스타일 편향이 없으므로 스타일 오염이 없습니다.
Contrast Controller: 수작업으로 제작된 LoRA. 모니터의 밝기 슬라이더처럼 대비를 조절합니다. 다른 "대비 향상" LoRA와 달리, 이 LoRA의 효과는 안정적이고 수학적으로 선형적이며 스타일에 전혀 부작용이 없습니다.
베이스 모델에 과채도 문제가 있거나, 매우 화려한 색상을 원할 때 유용합니다.
예시:

Style Strength Controller: 또는 과적합 효과 감소기. 모든 종류의 과적합 효과(객체, 밝기 등에 대한 편향)를 수학적으로 줄일 수 있습니다. 원한다면 증폭도 가능합니다.
Stabilizer와의 차이점:
Stabilizer는 실제 세계 데이터로 훈련되었습니다. 텍스처, 세부 사항 및 배경에 대한 과적합 효과를 "복원"하여 줄일 수만 있습니다.
Style Controller는 훈련되지 않았습니다. 베이스 모델의 훈련을 "취소"하는 것과 같아, 과적합을 줄입니다. 밝기, 객체 등 모든 과적합 효과를 수학적으로 줄일 수 있습니다.
이전 버전:
"업데이트 로그"를 참고하세요. 이전 버전은 매우 다른 효과를 가질 수 있습니다.
주요 타임라인:
현재 ~: 자연스러운 세부 사항과 텍스처, 안정적인 프롬프트 이해 및 더 높은 창의성. 순수한 2D 애니메이션 스타일로만 제한되지 않습니다.
illus01 v1.23 / nbep11 0.138 ~: 선명한 색상의 더 나은 애니메이션 스타일.
illus01 v1.3 / nbep11 0.58 ~: 더 나은 애니메이션 스타일.
업데이트 로그
(2025년 10월 21일): Noobai v-pred v0.280a
- 특별 버전. "a"는 애니메이션을 의미합니다. 기본 2D 애니메이션 스타일이 있습니다. 스타일을 프롬프트로 지정하지 않아도 사용하기 쉬워집니다. 또한 데이터셋이 많이 변경되었으므로, 이전 버전과 효과가 매우 다를 수 있습니다.
(2025년 8월 31일) NoobAI ep10 v0.273
이 버전은 NoobAI eps v1.0에서 처음부터 훈련되었습니다.
이전 illus01 v1.198와 비교:
극단적 조건에서 더 나으며 균형 잡힌 밝기. (nbvp v0.271과 동일)
향상된 텍스처와 디테일. 고 SNR 타임스텝에 더 많은 학습 단계를 적용했습니다. (illus01 버전은 호환성을 높이기 위해 해당 타임스텝을 건너뛰었습니다. 현재 모든 베이스 모델이 NoobAI이므로, 더 이상 해당 타임스텝을 건너뛸 필요가 없습니다.)
(2025년 8월 24일) NoobAI v-pred v0.271:
이전 v0.264와 비교:
극단적인 조건에서 더 나은 균형 잡힌 조명, 편향 감소.
동일한 이미지 내에서 고대비, 순수한 검정(0)과 흰색(255)을 동시에 구현 가능. 과도한 밝기나 채도 증가 없음. 이제 모두를 한 번에 얻을 수 있습니다.
(이전 v0.264는 과도한 밝기를 방지하기 위해 이미지를 10~250 사이로 제한했으며, 여전히 눈에 띄는 편향 문제가 있었고, 전체 이미지가 너무 어둡거나 밝아질 수 있었습니다.)
v0.264와 동일하게, 높은 강도 또는 최대 강도(0.9~1)를 선호합니다.
(2025년 8월 17일) NoobAI v-pred v0.264:
NoobAI v-pred 기반으로 처음 학습된 버전.
더 나은 조명과 과도한 밝기 감소를 제공합니다.
참고: 높은 강도 또는 최대 강도(0.9~1)를 선호합니다.
(2025년 7월 28일) illus01 v1.198
주로 v1.185c와 비교:
"c" 버전의 종료. "시각적으로 인상적"이라는 장점이 있지만 호환성 문제가 있었습니다. 예: 베이스 모델이 이미 대비 향상 기능을 가지고 있을 경우, 두 개의 대비 향상을 중첩하면 오히려 매우 나쁩니다. 따라서 더 이상 과도한 후처리 효과(고대비, 고채도 등)를 사용하지 않습니다.
대신, 더 많은 텍스처와 디테일, 영화 수준의 조명, 더 나은 호환성을 제공합니다.
이 버전은 데이터셋 전면 개편을 포함해 많은 부분을 변경했기 때문에, 이전 버전과 비교해 효과가 매우 다릅니다.
v1.185c의 과도한 효과를 다시 원하시는 분들은 이 페이지에서 순수하고 특화된 아트 스타일을 찾을 수 있습니다. LoRA에 충분한 데이터셋이 확보된다면, 해당 스타일을 학습해볼 예정입니다.
(2025년 6월 21일) illus01 v1.185c:
v1.165c와 비교:
선명도와 디테일 +100% 향상.
너무 혼란스러운 이미지(-30%) 감소. (적절히 설명할 수 없는 경우) 따라서 이 버전은 이전처럼 과도한 고대비를 제공하지 않지만, 일반적인 사용 사례에서는 더 안정적입니다.
(2025년 6월 10일): illus01 v1.165c
이 버전은 특별한 버전입니다. v1.164의 개선판이 아닙니다. "c"는 "colorful(화려한)", "creative(창의적인)", 때로는 "chaotic(혼란스러운)"을 의미합니다.
데이터셋은 매우 시각적으로 인상적인 이미지를 포함하지만, 때로는 설명하기 어려운 이미지가 많습니다. 예: 매우 화려한 색상, 높은 대비, 복잡한 조명 조건, 다양한 물체와 복잡한 패턴이 곳곳에 존재함.
따라서 "시각적으로 인상적인" 이미지를 얻을 수 있지만, "자연스러움"을 희생하게 됩니다. 부드러운 색조를 사용하는 스타일(예: 연필 드로잉 텍스처 등)에 영향을 줄 수 있습니다. 예: 이 버전은 v1.164처럼 연필 아트 텍스처를 완벽하게 생성할 수 없습니다.
(2025년 6월 4일): illus01 v1.164
프롬프트 이해력 향상. 현재 각 이미지에는 서로 다른 관점에서 생성된 3개의 자연어 캡션이 포함되어 있습니다. Danbooru 태그는 LLM에 의해 검사되며, 중요한 태그만 추출되어 자연어 캡션에 통합됩니다.
과노출 방지. 모델 출력이 #ffffff 순백색으로 치우치는 것을 방지하기 위한 편향을 추가했습니다. 대부분의 경우 #ffffff는 과노출을 의미하며, 많은 디테일이 사라집니다.
일부 학습 설정 변경. NoobAI(e-pred 및 v-pred 모두)와의 호환성 향상.
(2025년 5월 19일): illus01 v1.152
조명, 텍스처, 디테일 지속적 개선.
5천 장 이상의 이미지 추가, 더 많은 학습 단계로 인해 효과가 더욱 강화됨.
(2025년 5월 9일): nbep11 v0.205:
- v0.198의 밝기 및 색상 문제를 빠르게 수정. 이제 실제 사진처럼 밝기와 색상을 극단적으로 변경하지 않습니다. v0.198 자체는 나쁘지 않았지만, 너무 창의적이었습니다.
(2025년 5월 7일): nbep11 v0.198:
더 어두운 이미지 추가. 어두운 환경에서의 신체 왜곡 및 배경 문제 감소.
색상 및 대비 향상 기능 제거. 더 이상 필요하지 않기 때문입니다. 대신 Contrast Controller를 사용하세요.
(2025년 4월 25일): nbep11 v0.172
illus01 v1.93 ~ v1.121과 동일한 개선사항. 요약: 새로운 사진 데이터셋 "Touching Grass" 도입. 더 나은 자연스러운 텍스처, 배경, 조명. 캐릭터 효과 약화로 더 나은 호환성 확보.
색상 정확도 및 안정성 향상. (nbep11 v0.160 대비)
(2025년 4월 17일): illus01 v1.121
illustrious v0.1로 복원. illustrious v1.0 및 이후 버전은 의도적으로 AI 생성 이미지(데이터셋의 약 30%)로 학습되었습니다. 이는 LoRA 학습에 적절하지 않습니다. 논문을 읽고 나서야 이 점을 인지했습니다.
캐릭터 스타일 효과 감소. v1.23 수준으로 복원. 이 LoRA를 통해 캐릭터의 디테일이 줄어들지만, 호환성은 향상됩니다. 이는 상호 타협입니다.
나머지 항목은 아래(v1.113)와 동일합니다.
(2025년 4월 10일): illus01 v1.113 ❌
업데이트: 베이스 모델이 Illustrious v1.1 기반인 경우에만 이 버전을 사용하세요. 그렇지 않다면 illus01 v1.121을 사용하세요.
Illustrious v1.1 기반으로 학습.
새로운 데이터셋 "Touching Grass" 추가. 더 나은 자연스러운 텍스처, 조명, 심도 효과. 배경 구조적 안정성 향상. 왜곡된 방, 건물 등 배경 문제 감소.
LLM에서 생성된 완전한 자연어 캡션 적용.
(2025년 3월 30일): illus01 v1.93
- v1.72가 너무 강하게 학습되었으므로 전체 강도를 낮췄습니다. 더 나은 호환성을 제공합니다.
(2025년 3월 22일): nbep11 v0.160
- illus v1.72와 동일한 내용.
(2025년 3월 15일): illus01 v1.72
아래 ani40z v0.4에서 언급된 것과 동일한 텍스처 및 조명 데이터셋 사용. 더 자연스러운 조명 및 텍스처.
손의 향상을 위한 약 100장의 작은 데이터셋 추가. 예: 잔이나 컵을 잡는 등의 다양한 작업을 수행하는 손.
데이터셋에서 모든 "단순 배경" 이미지 제거. -200장.
학습 도구를 kohya에서 onetrainer로 전환. LoRA 구조를 DoRA로 변경.
(2025년 3월 4일) ani40z v0.4
Animagine XL 4.0 ani40zero 기반으로 학습.
자연스러운 역동적 조명 및 실제 세계 텍스처에 초점을 둔 약 1,000장의 데이터셋 추가.
더 자연스러운 조명 및 텍스처.
ani04 v0.1
- Animagine XL 4.0용 초기 버전. 주로 Animagine 4.0의 밝기 문제 해결을 목표로 함. 더 나은 대비 및 밝기.
illus01 v1.23
nbep11 v0.138
- 데이터셋 균형을 위해 퓨리/비인간/기타 이미지 일부 추가.
nbep11 v0.129
- 나쁜 버전. 효과가 너무 약하므로 무시하세요.
nbep11 v0.114
"전체 범위 색상" 구현. 자동으로 "일반적이고 아름다운" 방향으로 조정. 대부분의 사진 편집 도구에 있는 "한 번 클릭으로 사진 자동 보정" 버튼과 유사합니다. 이 최적화의 단점: 높은 편향을 막습니다. 예: 이미지의 95%를 검정, 5%를 밝게 하고 싶어도, 50/50으로 조정되지 않습니다.
약간의 현실적인 데이터 추가. 더 생생한 디테일, 조명, 덜 평평한 색상.
illus01 v1.7
nbep11 v0.96
더 많은 학습 이미지.
이후 소규모 "배경화면" 데이터셋(실제 게임 배경화면, 제가 찾을 수 있는 최고 품질의 이미지 약 100장)으로 다시 미세 조정. 디테일(피부, 머리카락 등에서 눈에 띄는 향상) 및 대비 개선.
nbep11 v0.58
- 더 많은 이미지. 학습 파라미터를 NoobAI 베이스 모델에 최대한 가깝게 조정.
illus01 v1.3
nbep11 v0.30
- 더 많은 이미지.
nbep11 v0.11: NoobAI epsilon pred v1.1 기반으로 학습.
- 개선된 데이터셋 태그. 개선된 LoRA 구조 및 가중치 분포. 안정성 향상 및 이미지 구성에 대한 영향 감소.
illus01 v1.1
- illustriousXL v0.1 기반으로 학습.
nbep10 v0.10
- NoobAI epsilon pred v1.0 기반으로 학습.









