Stabilizer IL/NAI
세부 정보
파일 다운로드
모델 설명
(2025년 10월 21일): 앞으로 나아갈 시간입니다...
이 모델은 더 이상 활발히 업데이트되지 않습니다. SDXL은 너무나도 오래되었습니다. 이는 2년 전(2023년 6월)에 출시되었습니다.
새로운 모델을 시도해보는 건 어떨까요? 이들은 더 최신의 아키텍처를 가지며, 성능이 우수하고 훨씬 더 효율적입니다. 예를 들어: Lumina 2. 만약 당신이 Lumina 2를 처음 들었다면, 빠르게 정보를 전달해 드리겠습니다:
2025년 1월에 출시. 오픈 소스. Apache 라이선스 2.0.
DiT 아키텍처(현재 가장 인기 있는 아키텍처로, Flux.1 등과 동일한 아키텍처).
작고 효율적. 단 2B 파라미터. 전체(fp16) 모델은 5GB, Q8 모델은 단 2.5GB로, 품질을 잃지 않고 GTX1050에서도 로드하고 실행할 수 있습니다.
동일한 Flux 16ch VAE 사용. 수학적으로 SDXL의 4ch VAE보다 4배 더 우수.
Google Gemma 2 2b를 텍스트 인코더로 사용(네, 이는 완전히 기능하는 LLM 챗모델입니다). SDXL의 오래된 CLIP보다 1000배나 뛰어납니다. CLIP은 태그만 이해할 수 있지만, 이는 영어뿐 아니라 중국어, 일본어 등도 지원합니다. 프롬프트를 얼마나 잘 이해하고 따를 수 있을까요? 다음 프롬프트를 입력해보세요: (참고: 이는 네 개의 이미지가 아니라 하나의 이미지입니다. 전체 이미지와 프롬프트는 여기에서 확인하세요. 아이디어는 여기에서 유래했습니다.)
Neta Lumina는 danbooru 및 e621 데이터셋으로 학습된 애니메이션 스타일의 미세 조정 모델입니다.
NetaYume Lumina는 추가로 미세 조정된 버전입니다.
저는 "개선 패키지" LoRA를 학습했습니다. 이름이 변경되어 오해를 줄였지만, 데이터셋은 동일합니다.
또한 Civitai가 Lumina 2를 지원하지 않을 것이라 생각합니다. 저는 이 모델을 TensorArt에도 업로드했습니다. 여기에서 저를 찾을 수 있습니다. 로컬 환경이 없으면 온라인으로 Lumina 2 모델을 시도해보세요.
관련 없는 개인적인 의견:
Chroma는 Lumina 2보다 더 나은 이미지 품질을 제공합니다. 결국 10B 크기의 Flux.1 모델에 5B 크기의 T5 텍스트 인코더를 사용하기 때문입니다(Lumina 2보다 5배, 2.5배 큼). 하지만 애니메이션에는 적합하지 않습니다.
AuraFlow는 어색합니다. 7B 모델. 작지 않습니다. 전반적으로 Flux.1보다 뛰어나지 않으며, Lumina 2보다 효율적이지 않습니다. 원래 v0.3 모델을 시도해보았는데, 이미지 품질은 원래 Lumina 2와 비슷했지만, 프롬프트 이해 능력은 명백히 떨어졌습니다.(gemma2는 pile-T5보다 훨씬 나은 것 같습니다)
Qwen은 멋지지만 너무나도 엄청나게 큽니다. H100을 대여하지 않는 한, 작은 LoRA조차도 학습할 수 없습니다.
(2025년 10월 21일): Noobai v-pred v0.280a
특별 버전. "a"는 애니메이션을 의미합니다. 기본 2D 애니메이션 스타일이 포함되어 있습니다. 스타일을 프롬프트로 지정하고 싶지 않다면 사용하기 쉽습니다. 그렇지 않다면, 더 창의적인 v0.271 버전을 권장합니다.
또한 데이터셋이 크게 변경되어, 전체적인 효과가 이전 버전과 상당히 다를 수 있습니다.
Stabilizer
7,000장의 이미지로 미세 조정된 대규모 소규모 모델입니다.
고정된 스타일보다 창의성에 초점을 맞춥니다. 데이터셋은 매우 다양합니다. 따라서 이 모델은 창의성을 제한하는 기본 스타일(편향)이 없습니다.
자연스러운 텍스처, 조명, 최상의 디테일만 포함합니다. 플라스틱처럼 광택 있는 AI 스타일은 없습니다. 모든 이미지를 제가 직접 선별했습니다. AI 이미지로 학습하면 일부 기이한 효과가 강화될 수 있다는 점을 알고 있지만, 저는 그 방식을 좋아하지 않습니다.
더 나은 프롬프트 이해력. 자연어 캡션으로 학습되었습니다.
(v-pred) 더 나으며 균형 잡힌 조명. 과도한 밝기나 채도가 없습니다. 같은 이미지 내에서 순수한 검정(0)과 흰색(255)을 원하시나요? 심지어 같은 위치에서도요? 전혀 문제되지 않습니다.
왜 기본 스타일이 없나요?
"기본 스타일"이란: 모델에 기본 스타일(편향)이 있다면, 어떤 프롬프트를 입력하더라도 모델은 반드시 같은 요소들(얼굴, 배경, 감정 등)을 생성합니다. 이것이 기본 스타일을 구성합니다.
장점: 사용이 쉽습니다. 스타일을 프롬프트로 지정할 필요가 없습니다.
단점: 하지만 그 스타일을 덮어쓸 수 없습니다. 기본 스타일과 어울리지 않는 프롬프트를 입력하면 모델은 이를 무시합니다. 스타일을 여러 개 겹쳐도 기본 스타일은 항상 다른 스타일을 덮거나 오염하거나 제한합니다.
"기본 스타일이 없음"은 편향이 없다는 뜻이며, 원하는 스타일을 태그나 LoRA로 명시해야 합니다. 하지만 이 모델은 스타일 간의 겹침이나 오염을 일으키지 않습니다. 겹친 스타일을 정확히 원하는 대로 얻을 수 있습니다.
왜 이 "미세 조정된 기본 모델"이 LoRA인가요?
저는 기가차드가 아니며, 수백만 장의 학습 이미지를 보유하고 있지 않습니다. 전체 기본 모델을 미세 조정할 필요는 없습니다. LoRA로 충분합니다.
제가 업로드해야 할 것은 단지 40MiB 크기의 작은 파일이며, 당신이 다운로드해야 할 것도 그와 같습니다. 7GiB에 달하는 거대한 체크포인트 대신입니다. 이는 데이터 및 저장 공간을 99.4% 절약합니다. 그래서 저는 자주 업데이트할 수 있습니다.
이 LoRA는 작아 보일 수 있지만, 여전히 강력합니다. 왜냐하면 Nvidia에서 개발한 새로운 아키텍처인 DoRA를 사용하기 때문입니다. 이는 전통적인 LoRA보다 더 효율적입니다.
그럼 이 "미세 조정된 기본 모델"은 어떻게 얻나요?
간단합니다.
사전 학습된 기본 모델 + 이 LoRA = "미세 조정된 기본 모델"
이 LoRA를 사전 학습된 기본 모델에 완전한 강도로 로드하세요. 그러면 사전 학습된 기본 모델이, 제가 콘텐츠 이미지에 사용한 미세 조정된 기본 모델이 됩니다. 아래의 "사용 방법"을 참조하세요.
이 모델을 사용한 합성 모델 공유는 금지됩니다. 참고로, 이 모델에는 보이지 않는 워터마크를 출력하는 숨겨진 트리거 단어가 포함되어 있습니다. 워터마크와 탐지기 모두 제가 직접 코딩했습니다. 저는 이를 사용하고 싶지 않지만, 사용할 수는 있습니다.
이 모델은 Civitai와 TensorArt에서만 공개되었습니다. 다른 플랫폼에서 "me"와 이 문장을 발견한다면, 모두 위조된 것이며, 사용 중인 플랫폼은 해적 플랫폼입니다.
댓글 섹션에 피드백을 남겨주세요. 그러면 모두가 볼 수 있습니다. Civitai의 리뷰 시스템에는 피드백을 쓰지 마세요. 그 시스템은 너무나 나쁘게 설계되어, 실제로 누구도 리뷰를 찾거나 볼 수 없습니다.
사용 방법
최신 버전:
nbvp10 v0.271 (NoobAI v-pred v1.0용 링크).
정확한 색상과 최상의 디테일. 지금까지 최고의 모델입니다.
이는 v-pred LoRA이며, 단지 NoobAI v-pred v1.0에서만 작동합니다. eps 모델에서는 작동하지 않습니다.
nbep10 v0.273 (NoobAI eps v1.0용 링크).
- v-pred 모델보다 채도와 대비가 낮습니다. 표준 엡실론(eps) 예측의 "작은 설계 결함" 때문입니다. 이는 모델이 더 넓은 색상 범위에 도달하는 것을 제한합니다. 그래서 이후에 v-pred가 개발되었습니다.
illus01 v1.198 (Illustrious v0.1로 학습됨).
- 현재 "Illustrious"로 라벨링된 대부분의 애니메이션 기본 모델(90%)이 사실상 NoobAI(또는 주로 NoobAI)임을 유의하세요. 두 버전 모두 시도해보고 어느 쪽이 더 나은지 확인하는 것이 좋습니다.
LoRA 스택에서 이 LoRA를 먼저 로드하세요.
이 LoRA는 Nvidia의 새로운 아키텍처인 DoRA를 사용하며, 전통적인 LoRA보다 효율적입니다. 그러나 전통적인 LoRA가 정적 패치 가중치를 사용하는 것과 달리, DoRA의 패치 가중치는 현재 로드된 기본 모델의 가중치(LoRA를 로드할 때 변경됨)에 따라 동적으로 계산됩니다. 예기치 않은 변화를 최소화하려면 이 LoRA를 먼저 로드하세요.
이 모델을 사용하는 두 가지 방법:
1). 미세 조정된 기본 모델로 사용 (권장):
최상의 자연스러운 디테일을 얻고, 원하는 스타일 조합을 완전한 제어 하에 구축하려는 경우.
이 LoRA를 사전 학습된 기본 모델에 완전한 강도로 먼저 로드하세요. 그러면 사전 학습된 기본 모델이, 제가 콘텐츠 이미지 생성에 사용한 미세 조정된 기본 모델이 됩니다.
2). 다른 미세 조정된 기본 모델의 LoRA로 사용.
결국 이는 LoRA입니다.
자주 묻는 질문:
콘텐츠 이미지는 원본 사전 학습 모델의 출력입니다. 1MP 해상도로, 마법 같은 플러그인, 업스케일, 손/얼굴 inpainting 보정, 부정적 프롬프트까지도 없습니다. 일부 사용자들이 재현할 수 없다고 말하지만, 이는 기술 부족입니다. (기본 모델이 맞지 않거나, 너무 많은 "최적화"를 추가했기 때문입니다.)
낮은 강도(예: <0.5)에서도 기본 모델이 파괴된다면, 그것은 당신의 기본 모델의 문제입니다. 당신의 기본 모델은 이미 이 LoRA를 병합했고(또는 두 번 병합했습니다), 모델 가중치가 곱해져 붕괴되었습니다. 가짜 기본 모델 제작자, 즉 도둑에 주의하세요. 일부 "제작자"는 학습을 하지 않고, 다른 사람들의 모델을 가져와 병합한 뒤, 모든 메타데이터와 크레딧을 삭제하고 자신이 만든 기본 모델처럼 판매합니다.

데이터셋
최신 버전 또는 최근 버전
총 약 7,000장의 이미지. 기가차드들이 수백만 장의 이미지로 모델을 미세 조정하는 것에 비하면 크지 않지만, 작지도 않습니다. 그리고 모든 이미지는 제가 직접 선별했습니다.
일반적으로 아름다운 것들만 포함. 설명할 수 없는 기이한 예술 스타일은 배제.
AI 이미지 없음. 제가 감시합니다.
고해상도 이미지만 사용. 전체 데이터셋의 평균 픽셀 수는 3.37MP, 약 1800x1800입니다.
모든 이미지에는 Google LLM에서 생성된 자연어 캡션이 포함되어 있습니다.
기타 도구
Stabilizer의 일부가 되려 했거나, 과거에 포함되었던 아이디어들이 이제 별도의 LoRA로 분리되었습니다. 더 나은 유연성을 위해. 컬렉션 링크: https://civitai.com/collections/8274233.
Dark: 어두운 환경에 편향된 LoRA. 일부 기본 모델의 과도한 밝기 편향을 수정하는 데 유용합니다. 낮은 밝기 이미지로 학습되었습니다. 스타일 편향이 없으므로 스타일 오염이 없습니다.
Contrast Controller: 수작업 LoRA. 모니터의 슬라이더처럼 대비를 조절할 수 있습니다. 다른 학습된 "대비 향상"과 달리, 이 LoRA의 효과는 안정적이고 수학적으로 선형적이며, 스타일에 아무런 부작용이 없습니다.
기본 모델의 과포화 문제를 해결하거나, 정말 화려한 색상을 원할 때 유용합니다.
예시:

Style Strength Controller: 또는 과적합 효과 감소기. 수학적으로 모든 종류의 과적합 효과(객체, 밝기 등에 대한 편향)를 줄일 수 있습니다. 원한다면 확대할 수도 있습니다.
Stabilizer와의 차이점:
Stabilizer는 실제 세계 데이터로 학습되었습니다. 텍스처, 디테일, 배경에 대한 과적합 효과를 "추가"하여만 줄일 수 있습니다.
Style Controller는 학습을 통해 생성되지 않았습니다. 기본 모델의 학습을 "취소"하는 것처럼 작동하여 과적합을 줄입니다. 밝기, 객체에 대한 편향 등 모든 과적합 효과를 수학적으로 줄일 수 있습니다.
이전 버전:
"업데이트 로그"에서 더 많은 정보를 확인할 수 있습니다. 이전 버전은 매우 다른 효과를 가질 수 있으므로 주의하세요.
주요 타임라인:
현재 ~: 자연스러운 디테일과 텍스처, 안정적인 프롬프트 이해 및 더 높은 창의성. 순수한 2D 애니메이션 스타일에만 제한되지 않습니다.
illus01 v1.23 / nbep11 0.138 ~: 생생한 색상이 더 좋은 애니메이션 스타일.
illus01 v1.3 / nbep11 0.58 ~: 개선된 애니메이션 스타일.
업데이트 로그
(2025년 10월 21일): Noobai v-pred v0.280a
- 특별 버전. "a"는 애니메이션을 의미합니다. 기본 2D 애니메이션 스타일이 포함되어 있어 스타일을 프롬프트로 지정하지 않아도 사용하기 쉽습니다. 데이터셋이 크게 변경되어, 효과가 이전 버전과 상당히 다를 수 있습니다.
(2025년 8월 31일) NoobAI ep10 v0.273
이 버전은 NoobAI eps v1.0에서 처음부터 학습되었습니다.
이전 illus01 v1.198과 비교:
극한 조건에서 더 나으며 균형 잡힌 밝기. (nbvp v0.271과 동일)
더 나은 텍스처 및 디테일. 높은 SNR 타임스텝에서 더 많은 학습 단계를 거쳤습니다. (illus01 버전은 호환성 문제를 피하기 위해 그 타임스텝을 건너뛰었습니다. 이제 모든 기본 모델이 NoobAI이므로, 더 이상 건너뛸 필요가 없습니다.)
(2025년 8월 24일) NoobAI v-pred v0.271:
이전 v0.264와 비교:
극한 조건에서 더 나으며 균형 잡힌 조명, 편향 감소.
고대비, 순수한 검정(0)과 흰색(255)을 동일한 이미지 내, 심지어 동일한 위치에서도 사용 가능. 과도한 밝기나 채도가 없습니다. 이제 모든 것을 동시에 얻을 수 있습니다.
(이전 v0.264는 과도한 밝기를 피하기 위해 이미지를 10~250 사이로 제한했고, 여전히 눈에 띄는 편향 문제가 있었으며, 전체 이미지가 너무 어둡거나 밝았습니다.)
v0.264와 마찬가지로, 높은 또는 전체 강도(0.9~1)를 선호합니다.
(2025년 8월 17일) NoobAI v-pred v0.264:
NoobAI v-pred로 학습된 첫 번째 버전.
더 나은 조명, 과도한 밝기 감소.
참고: 높은 또는 전체 강도(0.9~1)를 선호합니다.
(2025년 7월 28일) illus01 v1.198
이전 v1.185c와 비교:
"c" 버전의 종료. "시각적으로 인상적"이긴 하지만 호환성 문제가 있었습니다. 예를 들어, 기본 모델에 이미 유사한 대비 강화가 적용되어 있으면, 두 개의 대비 강화를 겹치는 것은 정말 나쁩니다. 따라서, 더 이상 기이한 후처리 효과(고대비, 고채도 등)를 사용하지 않습니다.
대신 더 많은 텍스처와 디테일. 영화 수준의 조명. 더 나은 호환성.
이 버전은 데이터셋 전면 개편을 포함해 많은 부분을 변경했기 때문에 이전 버전들과 비교해 효과가 상당히 다릅니다.
v1.185c의 미친 효과를 되돌리고 싶은 분들을 위해, 이 페이지에서 순수하고 전문적인 아트 스타일을 찾을 수 있습니다. LoRA를 위한 데이터셋이 충분히 크다면, 제가 하나를 학습할 수도 있습니다.
(2025년 6월 21일) illus01 v1.185c:
v1.165c와 비교:
+100% 선명도 및 디테일 향상.
-30% 너무 혼란스러운 이미지(적절히 설명할 수 없는 이미지). 따라서 이 버전은 더 이상 극단적인 대비 수준을 제공하지 못할 수 있지만, 일반적인 사용 사례에서는 더 안정적일 것입니다.
(2025년 6월 10일): illus01 v1.165c
이 버전은 특별한 버전입니다. 이는 v1.164의 개선판이 아닙니다. "c"는 "컬러풀하고", "창의적이며", 때로는 "혼란스러운"을 의미합니다.
데이터셋에는 시각적으로 매우 충격적인 이미지가 포함되어 있지만, 때로는 설명하기 어려운 경우도 있습니다. 예: 매우 화려한 색상, 높은 대비, 복잡한 조명 조건. 물체와 복잡한 패턴이 곳곳에 존재합니다.
따라서 시각적으로 충격적인 결과를 얻을 수 있지만, 그 대가로 "자연스러움"이 희생될 수 있습니다. 부드러운 색조를 가진 스타일에는 영향을 줄 수 있습니다. 예: 이 버전은 v1.164처럼 "연필 드로잉" 텍스처를 완벽하게 생성할 수 없습니다.
(2025년 6월 4일): illus01 v1.164
프롬프트 이해력 향상. 현재 각 이미지에는 서로 다른 관점에서의 3개의 자연스러운 캡션이 포함되어 있습니다. Danbooru 태그는 LLM에 의해 검사되어 중요한 태그만 추출해 자연스러운 캡션에 통합됩니다.
과노출 방지. 모델 출력이 #ffffff 순백색 수준에 도달하는 것을 방지하기 위한 편향을 추가했습니다. 대부분의 경우 #ffffff는 과노출을 의미하며, 이는 다양한 디테일을 잃게 합니다.
일부 학습 설정 변경. NoobAI와의 호환성을 높였습니다(e-pred 및 v-pred 모두).
(2025년 5월 19일): illus01 v1.152
조명, 텍스처, 디테일 지속적 개선.
5천 장 이상의 추가 이미지, 더 많은 학습 스텝을 통해 효과가 강화되었습니다.
(2025년 5월 9일): nbep11 v0.205:
- v0.198의 밝기 및 색상 문제를 빠르게 수정했습니다. 이제 실제 사진처럼 밝기와 색상을 극단적으로 변화시키지 않아야 합니다. v0.198은 나쁘지 않았지만, 단지 너무 창의적이었을 뿐입니다.
(2025년 5월 7일): nbep11 v0.198:
더 많은 어두운 이미지를 추가. 어두운 환경에서의 신체 왜곡과 배경 문제 감소.
색상 및 대비 강화 제거. 더 이상 필요하지 않기 때문입니다. 대신 Contrast Controller를 사용하세요.
(2025년 4월 25일): nbep11 v0.172
illus01 v1.93 ~ v1.121에서와 동일한 새로운 기능. 요약: 새로운 사진 데이터셋 "Touching Grass". 더 나은 자연 텍스처, 배경, 조명. 더 나은 호환성을 위한 약화된 캐릭터 효과.
색상 정확도 및 안정성 향상. (nbep11 v0.160과 비교)
(2025년 4월 17일): illus01 v1.121
illustrious v0.1로 롤백. illustrious v1.0 및 이후 버전은 의도적으로 AI 생성 이미지로 학습되었습니다(데이터셋의 약 30%). 이는 LoRA 학습에 이상적이지 않습니다. 논문을 읽고 나서야 이 사실을 인지했습니다.
캐릭터 스타일 효과 감소. v1.23 수준으로 복귀. 이 LoRA로 생성되는 캐릭터는 디테일이 줄어들겠지만, 호환성은 향상될 것입니다. 이는 트레이드오프입니다.
그 외 사항은 아래(v1.113)와 동일합니다.
(2025년 4월 10일): illus11 v1.113 ❌
업데이트: 기본 모델이 Illustrious v1.1 기반인 경우에만 이 버전을 사용하세요. 그렇지 않다면 illus01 v1.121을 사용하세요.
Illustrious v1.1 기반으로 학습되었습니다.
새로운 데이터셋 "Touching Grass" 추가. 더 나은 자연 텍스처, 조명, 심도 효과. 배경 구조적 안정성 향상. 왜곡된 방, 건물 등 배경 문제 감소.
LLM에서 생성된 완전한 자연어 캡션 적용.
(2025년 3월 30일): illus01 v1.93
- v1.72는 과도하게 학습되었습니다. 따라서 전반적인 강도를 줄였습니다. 더 나은 호환성을 기대할 수 있습니다.
(2025년 3월 22일): nbep11 v0.160
- illus v1.72와 동일한 내용.
(2025년 3월 15일): illus01 v1.72
아래 ani40z v0.4에서 언급된 것과 동일한 신규 텍스처 및 조명 데이터셋. 더 자연스러운 조명과 텍스처.
손의 디테일을 강화하기 위한 약 100장의 작은 데이터셋 추가. 유리, 컵 등을 잡는 등의 다양한 손 작업을 포함합니다.
데이터셋에서 모든 "단순 배경" 이미지 제거. -200장.
학습 도구를 kohya에서 onetrainer로 전환. LoRA 아키텍처를 DoRA로 변경.
(2025년 3월 4일) ani40z v0.4
Animagine XL 4.0 ani40zero 기반으로 학습.
자연스러운 역동적 조명과 실제 세계 텍스처에 초점을 맞춘 약 1,000장의 데이터셋 추가.
더 자연스러운 조명과 텍스처.
ani04 v0.1
- Animagine XL 4.0의 초기 버전. 주로 Animagine 4.0의 밝기 문제를 해결하기 위해 제작. 더 나은 대비 및 밝기.
illus01 v1.23
nbep11 v0.138
- 데이터셋 균형을 위해 퓨리/비인간/기타 이미지 일부 추가.
nbep11 v0.129
- 나쁜 버전. 효과가 너무 약하므로 무시하세요.
nbep11 v0.114
"풀 레인지 컬러" 구현. "일반적이고 아름다운" 방향으로 자동 균형을 조정합니다. 대부분의 이미지 편집 도구의 "원클릭 사진 자동 보정" 버튼과 유사합니다. 이 최적화의 단점: 높은 편향을 방지합니다. 예: 이미지의 95%를 검정색, 5%만 밝게 하고 싶어도 50/50으로 균형 잡히지 않도록 합니다.
약간의 사실적인 데이터 추가. 더 생생한 디테일, 조명, 덜 평평한 색상.
illus01 v1.7
nbep11 v0.96
더 많은 학습 이미지.
이후 작은 "배경화면" 데이터셋(실제 게임 배경화면, 제가 구할 수 있는 최고 품질 약 100장)으로 또 다시 미세 조정. 디테일(피부, 머리카락에서 두드러짐) 및 대비 향상.
nbep11 v0.58
- 더 많은 이미지. 학습 파라미터를 NoobAI 기본 모델에 최대한 가깝게 조정.
illus01 v1.3
nbep11 v0.30
- 더 많은 이미지.
nbep11 v0.11: NoobAI epsilon pred v1.1 기반으로 학습.
- 개선된 데이터셋 태그. LoRA 구조 및 가중치 분포 개선. 이미지 구성에 대한 영향이 줄어들고 더 안정적이 되었습니다.
illus01 v1.1
- illustriousXL v0.1 기반으로 학습.
nbep10 v0.10
- NoobAI epsilon pred v1.0 기반으로 학습.






