Kirazuri Lazuli (Noobai V-Pred)

세부 정보

파일 다운로드

모델 설명

키라즈리 라줄리 (Noobai V-Pred)

이 체크포인트는 NoobAI-XL (NAI-XL) V-Pred 1.0-Version의 완전한 패인튜닝 버전으로, 4090 GPU에서 로컬로 학습된 개인 프로젝트입니다. 기초 모델로부터 약 370GPU 시간 동안 총 15,069장의 이미지(378,550스텝)를 사용하여 학습했으며, 스텝당 평균 소요 시간은 3.52초입니다.

이 모델은 기초 모델의 데이터 컷오프 시점(2024/10/24) 이후의 추가 지식을 학습하는 데 초점을 맞추고 있으며, 애니메이션, 비디오 게임, 가상 유튜버의 스타일, 개념, 캐릭터를 포함합니다.

사용법 - 중요

이 모델은 NoobAI-XL (NAI-XL) V-Pred 1.0-Version을 기반으로 학습되었으며, v-예측 모델로 구현되어 있습니다(eps-예측과 다름). 특정 파라미터 설정이 필요합니다.

이 체크포인트를 사용할 때는 기초 모델 및 그 사용법을 숙지하는 것이 권장됩니다.

학습 목적은 기존 지식을 저하시키지 않으면서 기초 모델의 지식을 확장하는 것입니다.


다음은 제 개인 설정입니다. 기초 모델에 대한 귀하의 선호 설정은 대부분 그대로 적용 가능합니다.

샘플러는 생성 시 Euler, 업스케일링/인페인팅 시 Euler Ancestral을 사용하세요.

(⚠️ 다른 샘플러는 작동하지 않을 수 있으며, CivitAI 기본 샘플러 중 일부인 Karras도 마찬가지입니다.)

미리보기는 ComfyUI 워크플로우를 사용하여 DynamicThresholdingFull, 업스케일링, 및 FaceDetailer를 통해 생성되었습니다.

CFG 10에서 사용한 DynamicThresholding (CFG-Fix) 설정:

dynthres_enabled: True, dynthres_mimic_scale: 7, dynthres_threshold_percentile: 1, dynthres_mimic_mode: Half Cosine Down, dynthres_mimic_scale_min: 1, dynthres_cfg_mode: Half Cosine Down, dynthres_cfg_scale_min: 3, dynthres_sched_val: 1, dynthres_separate_feature_channels: enable, dynthres_scaling_startpoint: ZERO, dynthres_variability_measure: STD, dynthres_interpolate_phi: 1

reForge 또는 Forge도 버전 1.0 이후로 사용 가능하며, 해당 버전에서 발생한 문제로 불편을 드려 죄송합니다.

*Forge/reForge에서 자동으로 v-pred 모델로 인식되도록, 이 스크립트를 사용하여 모델 상태 사전에 znstrv_pred 키를 추가했습니다.

추천 프롬프트 구조:

품질 수식어 masterpiece, best quality, very aesthetic는 프롬프트의 에 배치하세요.

아티스트 이름은 토큰 누출을 방지하기 위해 artist: 접두사를 붙이세요.

ComfyUI에서는 comfyui-prompt-control 확장을 통해 A1111 스크립트 문법을 사용하여 아티스트 스타일을 결합합니다. 예: artist:[artist1|artist2|artist3]

일부 경우 Attention Couple을 사용한 지역적 프롬프팅이 적용되었습니다.(예시)

긍정적 프롬프트:

{{characters}}, {{copywrites}}, {{artists}},
{{tags}},
absurdres, masterpiece, best quality, very aesthetic

학습 세부사항

사용된 학습 설정은 kohya-ss/sd-scripts이며, github에서 확인할 수 있습니다.

v2.1

이 버전은 업데이트된 개인 심미적 패인튜닝 데이터셋(masterpieces)과 최근 캐릭터, 의상, 스타일을 추가로 학습했습니다:

  • 데이터 컷오프: 2025/07/15

  • v2.0 기반 지속 학습

  • 학습 이미지: 1,004장

  • 정칙화 이미지: 314장 (v2.0에서 생성)

  • 최적화기: Adafactor

  • 학습 정밀도: Full fp32

  • 배치 크기: 4

  • U-Net 학습률: 6e-6

  • TE 학습률: 2e-6

  • 에포크: 50

  • 스텝: 25,950

v2.0

이 버전은 이 체크포인트에서 학습하려 했던 모든 캐릭터, 개념, 스타일에 대해 훨씬 나은 표현력을 보입니다.

전체 데이터셋에 최근 데이터를 확장해 단일 학습 실행:

  • 데이터 컷오프: 2025/06/13

  • 학습 이미지: 14,065장

  • 정칙화 이미지: 7,056장 (NoobAI-XL (NAI-XL) V-Pred 1.0-Version에서 생성)

  • 최적화기: Adafactor

  • 학습 정밀도: Full fp32

  • 배치 크기: 4

  • U-Net 학습률: 6e-6

  • TE 학습률: 2e-6

  • 에포크: 50

  • 스텝: 352,600 (~344 GPU 시간, 스텝당 3.52초)

v1.1

PixelWave.에서 영감을 받아 개발된 반복적 체크포인트 학습 방식입니다.

약 1,200장의 이미지로 구성된 데이터셋 배치를 10회 학습한 후, 마지막으로 267장의 심미적 패인튜닝 데이터셋으로 마무리했습니다.

  • 데이터 컷오프: 2025/05/25

  • 최적화기: Adafactor

  • 학습 정밀도: Full fp32

  • 배치 크기 및 학습률은 여러 차례 조정됨

    • 배치 크기 4, 학습률 6e-6이 가장 안정적임
  • 10번째 및 11번째 학습 세션에서는 TE를 배치 크기 4, 학습률 2e-6로 학습

  • 최종 심미적 학습에 사용된 10번째 체크포인트에서 생성된 정칙화 데이터셋으로 이전에 학습된 캐릭터를 보존

학습된 새 시리즈/캐릭터 목록:

학습된 개념에 대한 추가 미리보기는 버전 2.0에서 확인 가능합니다.

애니메이션:

  • dandadan

  • dr. stone

  • gachiakuta

  • girumasu

  • gundam gquuuuuux

  • kaijuu no.8

  • kaoru hana wa rin to saku

  • kusuriya no hitorigoto

  • solo leveling

  • sono bisque doll wa koi wo suru

  • witch watch

  • yofukashi no uta

비디오 게임:

  • elden ring nightreign

  • metaphor: refantazio

  • monster hunter wilds

  • fate/go (lilith)

  • genshin impact (citlali, escoffier, lan-yan, varesa, xilonen, yumemizuki mizuki)

  • honkai star rail (aglaea, castorice, cipher)

  • wuthering waves (carlotta, cartethyia, chisa, ciaccona, zani)

  • zenless zone zero (astra-zao, cipher, ju-fufu, luciana de montefio, pulchra fellini, sweety, trigger, vivian-banshee, yi xuan)

hololive:

  • flow glow (isaki riona, kikirara vivi, koganei niko, mizumiya su, rindo chihaya)

  • hoshimachi suisei (11th, caramel-pain, kireigoto, spectra-of-nova, supernova)

  • himemori luna (7th)

  • houshou marine (ahoy pirates)

  • natsuiro matsuri (jersey maid)

  • nekomata okayu (personya respect)

  • ookami mio (8th)

  • oozora subaru (police)

  • roboco san (oriental)

  • shirakami fubuki (fbkingdom)

  • usada-pekora (10th)

인디 V-튜버:

  • amagai ruka

  • dooby

  • nimi nightmate

  • sameko saba

  • yuuki sakuna

기타:

  • myaku-myaku (expo2025)

학습된 개념 목록:

의상:

  • 고대 그리스 복장

  • chronopattern 드레스

  • jirai kei

  • 워터 드레스

  • holonatsu paradise (의상)

개념:

  • 네 번째 벽

  • 별 궤적

  • 꽃밭

  • mechabare

  • 몬스터 걸

  • 뱀의 해

추천 스타일 컨트롤 태그 목록:

103명의 아티스트 데이터셋에서 의도적으로 태그화/선별된 스타일 트리거:

  • blending

  • flat color

  • no lineart

  • impasto

  • painterly

  • chiaroscuro

  • impressionism

  • ink wash painting

  • pastel colors

  • pencil art

  • neon palette

  • dark

  • colorful

전통 미디어 그룹 태그도 학습되었습니다:

(일부는 충분한 데이터가 없어 지원되지 않음)

  • traditional media

  • acrylic paint \(medium\)

  • ballpoint pen \(medium\)

  • brush \(medium\)

  • calligraphy brush \(medium\)

  • charcoal \(medium\)

  • colored pencil \(medium\)

  • color ink \(medium\)

  • crayon \(medium\)

  • gouache \(medium\)

  • graphite \(medium\)

  • ink \(medium\)

  • marker \(medium\)

  • millipen \(medium\)

  • nib pen \(medium\)

  • oil painting \(medium\)

  • painting \(medium\)

  • pastel \(medium\)

  • watercolor \(medium\)

감사의 말

기초 모델 NoobAI-XL (NAI-XL) V-Pred 1.0-Version을 제공해 주신 Laxhar Lab에게 감사드립니다.

다양한 학습 데이터셋, 이미지 처리 도구 및 모델을 오픈소스로 공개해 주신 narugo1992deepghs 팀에게 감사드립니다.

sd-scripts 트레이너를 제공해 주신 kohya-ss에게 감사드립니다.

라이선스

기초 모델의 라이선스는 Noobai License를 따르며, 내용은 다음과 같습니다:


이 모델의 라이선스는 https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0fair-ai-public-license-1.0-sd를 계승하며, 아래 조건을 추가합니다. 이 모델 및 그 변형의 모든 사용은 본 라이선스에 구속됩니다.

I. 사용 제한

  • 괴롭힘, 위협, 허위 정보 유포를 포함한 유해하거나 악의적, 불법적인 활동 사용 금지

  • 비윤리적 또는 불쾌한 콘텐츠 생성 금지

  • 사용자의 관할권 내 법률 및 규정 위반 금지

II. 상업적 사용 금지

모델, 파생 모델, 또는 모델 생성 제품의 수익화 및 상업적 사용을 포함한 모든 형태의 상업화를 금지합니다.

III. 오픈소스 커뮤니티

활발한 오픈소스 커뮤니티를 조성하기 위해 사용자는 다음 요구사항을 반드시 준수해야 합니다:

  • 파생 모델, 병합 모델, LoRA, 및 위 모델 기반 제품을 오픈소스로 공개

  • 합성 공식, 프롬프트, 워크플로우 등의 작업 세부사항 공유

  • 파생 작업이 계속 오픈소스로 유지되도록 fair-ai-public-license를 준수

IV. 면책 조항

생성된 모델은 예상치 못하거나 유해한 출력을 생성할 수 있습니다. 사용자는 사용으로 인해 발생할 수 있는 모든 위험 및 잠재적 결과를 자가 책임으로 지닙니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.