Kirazuri Lazuli (Noobai V-Pred)
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
키라즈리 라줄리 (Noobai V-Pred)
이 체크포인트는 NoobAI-XL (NAI-XL) V-Pred 1.0-Version의 완전한 패인튜닝 버전으로, 4090 GPU에서 로컬로 학습된 개인 프로젝트입니다. 기초 모델로부터 약 370GPU 시간 동안 총 15,069장의 이미지(378,550스텝)를 사용하여 학습했으며, 스텝당 평균 소요 시간은 3.52초입니다.
이 모델은 기초 모델의 데이터 컷오프 시점(2024/10/24) 이후의 추가 지식을 학습하는 데 초점을 맞추고 있으며, 애니메이션, 비디오 게임, 가상 유튜버의 스타일, 개념, 캐릭터를 포함합니다.
사용법 - 중요
이 모델은 NoobAI-XL (NAI-XL) V-Pred 1.0-Version을 기반으로 학습되었으며, v-예측 모델로 구현되어 있습니다(eps-예측과 다름). 특정 파라미터 설정이 필요합니다.
이 체크포인트를 사용할 때는 기초 모델 및 그 사용법을 숙지하는 것이 권장됩니다.
학습 목적은 기존 지식을 저하시키지 않으면서 기초 모델의 지식을 확장하는 것입니다.
다음은 제 개인 설정입니다. 기초 모델에 대한 귀하의 선호 설정은 대부분 그대로 적용 가능합니다.
샘플러는 생성 시 Euler, 업스케일링/인페인팅 시 Euler Ancestral을 사용하세요.
(⚠️ 다른 샘플러는 작동하지 않을 수 있으며, CivitAI 기본 샘플러 중 일부인 Karras도 마찬가지입니다.)
미리보기는 ComfyUI 워크플로우를 사용하여 DynamicThresholdingFull, 업스케일링, 및 FaceDetailer를 통해 생성되었습니다.
CFG 10에서 사용한 DynamicThresholding (CFG-Fix) 설정:
dynthres_enabled: True, dynthres_mimic_scale: 7, dynthres_threshold_percentile: 1, dynthres_mimic_mode: Half Cosine Down, dynthres_mimic_scale_min: 1, dynthres_cfg_mode: Half Cosine Down, dynthres_cfg_scale_min: 3, dynthres_sched_val: 1, dynthres_separate_feature_channels: enable, dynthres_scaling_startpoint: ZERO, dynthres_variability_measure: STD, dynthres_interpolate_phi: 1
reForge 또는 Forge도 버전 1.0 이후로 사용 가능하며, 해당 버전에서 발생한 문제로 불편을 드려 죄송합니다.
*Forge/reForge에서 자동으로 v-pred 모델로 인식되도록, 이 스크립트를 사용하여 모델 상태 사전에 znstr 및 v_pred 키를 추가했습니다.
추천 프롬프트 구조:
품질 수식어 masterpiece, best quality, very aesthetic는 프롬프트의 끝에 배치하세요.
아티스트 이름은 토큰 누출을 방지하기 위해 artist: 접두사를 붙이세요.
ComfyUI에서는 comfyui-prompt-control 확장을 통해 A1111 스크립트 문법을 사용하여 아티스트 스타일을 결합합니다. 예: artist:[artist1|artist2|artist3]
일부 경우 Attention Couple을 사용한 지역적 프롬프팅이 적용되었습니다.(예시)
긍정적 프롬프트:
{{characters}}, {{copywrites}}, {{artists}},
{{tags}},
absurdres, masterpiece, best quality, very aesthetic
학습 세부사항
사용된 학습 설정은 kohya-ss/sd-scripts이며, github에서 확인할 수 있습니다.
v2.1
이 버전은 업데이트된 개인 심미적 패인튜닝 데이터셋(masterpieces)과 최근 캐릭터, 의상, 스타일을 추가로 학습했습니다:
데이터 컷오프: 2025/07/15
v2.0 기반 지속 학습
학습 이미지: 1,004장
정칙화 이미지: 314장 (v2.0에서 생성)
최적화기: Adafactor
학습 정밀도: Full fp32
배치 크기: 4
U-Net 학습률: 6e-6
TE 학습률: 2e-6
에포크: 50
스텝: 25,950
v2.0
이 버전은 이 체크포인트에서 학습하려 했던 모든 캐릭터, 개념, 스타일에 대해 훨씬 나은 표현력을 보입니다.
전체 데이터셋에 최근 데이터를 확장해 단일 학습 실행:
데이터 컷오프: 2025/06/13
학습 이미지: 14,065장
정칙화 이미지: 7,056장 (NoobAI-XL (NAI-XL) V-Pred 1.0-Version에서 생성)
최적화기: Adafactor
학습 정밀도: Full fp32
배치 크기: 4
U-Net 학습률: 6e-6
TE 학습률: 2e-6
에포크: 50
스텝: 352,600 (~344 GPU 시간, 스텝당 3.52초)
v1.1
PixelWave.에서 영감을 받아 개발된 반복적 체크포인트 학습 방식입니다.
약 1,200장의 이미지로 구성된 데이터셋 배치를 10회 학습한 후, 마지막으로 267장의 심미적 패인튜닝 데이터셋으로 마무리했습니다.
데이터 컷오프: 2025/05/25
최적화기: Adafactor
학습 정밀도: Full fp32
배치 크기 및 학습률은 여러 차례 조정됨
- 배치 크기 4, 학습률 6e-6이 가장 안정적임
10번째 및 11번째 학습 세션에서는 TE를 배치 크기 4, 학습률 2e-6로 학습
최종 심미적 학습에 사용된 10번째 체크포인트에서 생성된 정칙화 데이터셋으로 이전에 학습된 캐릭터를 보존
학습된 새 시리즈/캐릭터 목록:
학습된 개념에 대한 추가 미리보기는 버전 2.0에서 확인 가능합니다.
애니메이션:
dandadan
dr. stone
gachiakuta
girumasu
gundam gquuuuuux
kaijuu no.8
kaoru hana wa rin to saku
kusuriya no hitorigoto
solo leveling
sono bisque doll wa koi wo suru
witch watch
yofukashi no uta
비디오 게임:
elden ring nightreign
metaphor: refantazio
monster hunter wilds
fate/go (lilith)
genshin impact (citlali, escoffier, lan-yan, varesa, xilonen, yumemizuki mizuki)
honkai star rail (aglaea, castorice, cipher)
wuthering waves (carlotta, cartethyia, chisa, ciaccona, zani)
zenless zone zero (astra-zao, cipher, ju-fufu, luciana de montefio, pulchra fellini, sweety, trigger, vivian-banshee, yi xuan)
hololive:
flow glow (isaki riona, kikirara vivi, koganei niko, mizumiya su, rindo chihaya)
hoshimachi suisei (11th, caramel-pain, kireigoto, spectra-of-nova, supernova)
himemori luna (7th)
houshou marine (ahoy pirates)
natsuiro matsuri (jersey maid)
nekomata okayu (personya respect)
ookami mio (8th)
oozora subaru (police)
roboco san (oriental)
shirakami fubuki (fbkingdom)
usada-pekora (10th)
인디 V-튜버:
amagai ruka
dooby
nimi nightmate
sameko saba
yuuki sakuna
기타:
- myaku-myaku (expo2025)
학습된 개념 목록:
의상:
고대 그리스 복장
chronopattern 드레스
jirai kei
워터 드레스
holonatsu paradise (의상)
개념:
네 번째 벽
별 궤적
꽃밭
mechabare
몬스터 걸
뱀의 해
추천 스타일 컨트롤 태그 목록:
103명의 아티스트 데이터셋에서 의도적으로 태그화/선별된 스타일 트리거:
blending
flat color
no lineart
impasto
painterly
chiaroscuro
impressionism
ink wash painting
pastel colors
pencil art
neon palette
dark
colorful
전통 미디어 그룹 태그도 학습되었습니다:
(일부는 충분한 데이터가 없어 지원되지 않음)
traditional media
acrylic paint \(medium\)
ballpoint pen \(medium\)
brush \(medium\)
calligraphy brush \(medium\)
charcoal \(medium\)
colored pencil \(medium\)
color ink \(medium\)
crayon \(medium\)
gouache \(medium\)
graphite \(medium\)
ink \(medium\)
marker \(medium\)
millipen \(medium\)
nib pen \(medium\)
oil painting \(medium\)
painting \(medium\)
pastel \(medium\)
watercolor \(medium\)
감사의 말
기초 모델 NoobAI-XL (NAI-XL) V-Pred 1.0-Version을 제공해 주신 Laxhar Lab에게 감사드립니다.
다양한 학습 데이터셋, 이미지 처리 도구 및 모델을 오픈소스로 공개해 주신 narugo1992 및 deepghs 팀에게 감사드립니다.
sd-scripts 트레이너를 제공해 주신 kohya-ss에게 감사드립니다.
라이선스
기초 모델의 라이선스는 Noobai License를 따르며, 내용은 다음과 같습니다:
이 모델의 라이선스는 https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0의 fair-ai-public-license-1.0-sd를 계승하며, 아래 조건을 추가합니다. 이 모델 및 그 변형의 모든 사용은 본 라이선스에 구속됩니다.
I. 사용 제한
괴롭힘, 위협, 허위 정보 유포를 포함한 유해하거나 악의적, 불법적인 활동 사용 금지
비윤리적 또는 불쾌한 콘텐츠 생성 금지
사용자의 관할권 내 법률 및 규정 위반 금지
II. 상업적 사용 금지
모델, 파생 모델, 또는 모델 생성 제품의 수익화 및 상업적 사용을 포함한 모든 형태의 상업화를 금지합니다.
III. 오픈소스 커뮤니티
활발한 오픈소스 커뮤니티를 조성하기 위해 사용자는 다음 요구사항을 반드시 준수해야 합니다:
파생 모델, 병합 모델, LoRA, 및 위 모델 기반 제품을 오픈소스로 공개
합성 공식, 프롬프트, 워크플로우 등의 작업 세부사항 공유
파생 작업이 계속 오픈소스로 유지되도록 fair-ai-public-license를 준수
IV. 면책 조항
생성된 모델은 예상치 못하거나 유해한 출력을 생성할 수 있습니다. 사용자는 사용으로 인해 발생할 수 있는 모든 위험 및 잠재적 결과를 자가 책임으로 지닙니다.




















