SagaXL-ZtnV
세부 정보
파일 다운로드
모델 설명
SagaXL 사가 시리즈 (ZtnV) 실험용 모델 그룹
사지, 지혜, 욕망을 해방하자! RR002 이후에는 Emo 계열로 조정되었습니다.
SDXL 바닐라 모델(표준)을 ZtSNR(비 V-pred)로 학습하고, 색 영역 확장/색조 보정을 거쳐 이 XLBB(XL-Base-typeB)를 SDXL(표준)로 전이 학습하여 XLBBP로 만들었습니다.
ZtnV는 ZtSNR이며 non V-pred를 의미합니다. 순수 색상 표현이 가능하고 색상 및 색 영역에서 뛰어납니다. 다팔, 다족 등은 약간의 영향이 남아 있습니다.
권장 설정은 이 설명의 마지막에 기재되어 있으므로 CFG, 해상도 등 설정의 참고로 사용하세요. 샘플 이미지의 설정값도 참고하세요.
SagaXL-RR004 fix는 RR003 emx를 수정한 모델입니다.
R003을 기반으로 독자 개발한 optimizer 그룹(Emo계열 EmoFact(v3.0))을 사용한 LoRA 미세 조정과, 극저값 AKN(avg_key_norm) 및 고학습률(LR)을 이용한 '자기 수복'을 수행하여 모델 이름에 fix를 추가했습니다.
극저값 AKN(avg_key_norm) 및 고학습률(LR)을 이용한 '자기 수복'은 Emo 계열에서만 구현 가능한 특수 효과로, 특히 Emo 계열 fact 형식(fact, zeal 등)이 잘하는 새로운 학습법입니다. 간단히 말해, 지도 데이터를 참고하여 텍스트 인코더 등을 최소한의 학습으로 수복합니다. 국소 최적해를 전역 최적해에 가깝게 이끌어내 generalization과 다양성을 부여합니다.
이것은 모델의 특징과 성능을 끌어내고, 매몰된 정보나 질감을 끌어내는 효과를 갖습니다. 이 최적화(수복 학습)를 수행했습니다.
SagaXL-RR003 emx는 ◆ 실패작 ◆ 이었습니다💦 곧 삭제 예정
R001을 기반으로 독자 개발한 optimizer 그룹(Emo계열 EmoLynx(v3.0))을 사용한 LoRA 미세 조정을 수행하고 모델 이름에 emx를 추가했습니다.
리얼리즘을 구현했습니다. EmoLynx를 통한 정교화 테스트이기도 합니다. 음영 등에서 리얼리즘이 향상되었습니다. 더 많은 리얼리즘을 추가하고 싶었습니다. 이번 최종 조정의 3e-5, 3000step은 다소 딱딱한 업데이트일 수 있습니다. 다음에는 더 부드러운 업데이트로 하겠습니다.
SagaXL-RR002 enx는,
R002를 기반으로 독자 개발한 optimizer 그룹(EmoSens계열)을 사용한 LoRA 미세 조정을 수행하고 모델 이름에 enx를 추가했습니다. SDXL이 가진 가능성을 믿을 수 있는 완성도라고 생각합니다. 사용한 optimizer는 Emo계열(제2세대) 전체, emosens, airy, cats입니다. Kohya-script의 ZtSNR도 적용되었습니다.
SagaXL-RR002는,
R001을 기반으로 독자 개발한 optimizer 그룹(EmoNAVI계열)을 사용한 LoRA 미세 조정을 수행하고 모델 이름에 emx를 추가했습니다. 이번 UPDATE로 조정은 대체로 완료된 모델로 인식합니다.
SagaXL-RR001은,
BeppinXL에 BejeanXL을 약 0.03125 비율로 혼합하여 이 기반으로 원래 코드 그룹(muooonKit)을 사용하여 자기 지도 강화 학습에 의한 자기 진화를 수행했습니다. 핵심 기술은 독자 개발한 optimizer(Ref-AdamW-mini-ScheduleFree)이며, 그 외에는 SVD 적용을 통한 LoRA에 간헐적 작용을 수행하는 코드와 중심 코드로 모델을 학습했습니다. Hako-mikan氏의 TrainTrain에 Ref-AdamW-mini, SVD 적용 간헐적 작용 및 개입 코드를 독자 구현하여 효과를 확인했습니다. 기타 코드를 통한 베이스 모델 강화도 수행했습니다.
BeppinDX(alpha)는,
BejeanXL과 다른 새로운 XLBB-Plus계(파생형)을 기반으로 한 모델입니다. 원래 코드를 이용하여 SVD계 XLBBP 모델을 사용하고 가상의 자기 강화 학습 등을 적용했습니다.
BejeanXL(beta)는,
모든 모델에 공통된 SDXL(표준) 모델을 XLBBP로 대체하고, 기반부터 색 영역과 색조를 개선하여 리얼리즘과 정밀도를 향상시켰습니다. XLBBP를 기반으로 한 모델입니다.
또한 2000장의 이미지에 간단한 FFT를 적용하고, 이 새로운 BejeanXL에 애니메이션 이미지와 리얼 이미지를 혼합 학습한 LoRA를 적용했습니다.
권장 설정(Recommended setting):
CFG scale: 3-7, SDE SGMUniform (ZtSNR / NonVpred) 이므로 SGMUniform 추천
(reForge는 Sampler: RES Solver, Schedule: React Cosinusoidal DynSF도 좋습니다)
해상도: 1024x1024 이상을 권장, RR002 이후는 mahiro-CFG 사용하지 않는 것이 좋습니다.
SagaXL은 실험용 모델입니다. 상업적, 불법적 사용은 자제해 주세요.
원래 코드에 의한 실험적 요소로 문제가 발생할 수 있습니다.
어떤 이상이나 문제가 발생하면 사용을 중단하고 모델을 삭제해 주세요.










