Emolution15
세부 정보
파일 다운로드
모델 설명
SD1.5 새로운 테스트 모델(epsilon-scaling 사용) 학습 2048px 32000스텝 "EmoNAVI"
| 권장 설정 | ※ 아직 학습 중인 데모 모델입니다
epsilon-scaling: 1.02 (A1111·forge 비대응 / reforge 등 최신 버전에서만 지원)
960 x 1280px 이하(또는 Kohya-HiRES 사용)
DPM++ 2M SDE SGM Uniform, CFG: 5, Clip skip: 2,
EmolutionVAE: 모델 내장 / EQ-VAE(SDXL)을 미량 혼합한 840000
과거에 제작한 SD15 모델을 EmoNAVI를 사용해 실제 사진으로 학습했습니다.
해상도: 2048px로 학습함에 따라 고해상도 영역은 약 1280px까지 실용적으로 활용 가능해졌습니다.
(단, epsilon-scaling 사용 권장 / 더욱 높은 해상도는 Kohya-HiRES로 가능)
e-pred 방식에 ZtSNR을 적용해 완전한 검정과 흰색도 표현 가능하며, 색역도 확장되었습니다.
VAE는 기본값인 840000에 SDXL의 EQ-VAE를 미량 결합하여 통합했습니다.
학습 시에도 이 새로운 VAE를 사용했습니다.
SDXL의 Clip-G 패딩 문제 등을 회피하면서 VRAM 부하가 적은 환경을 유지하기 위해,
SD15를 다시 활용하는 시도입니다.
| 학습 개요 | 개요는 다음과 같습니다
기존 Emolution 모델(fp8 로드), EmoNAVI(constant), 5e-5, bf16, 2048px,
EmolutionVAE(SDXL: EQ-VAE를 미량 혼합한 840000), 전체 레이어 LoRA(c3lier),
e-pred, ZtSNR(Debiased-Estimation), Huber-SNR, R16·8 / A16·8,
※ EmoNAVI 사용 시 동적 Rank, 동적 Alpha 등 SVD 계열의 상위 호환 기능을 제공합니다
향후 APU(내장 GPU), NPU, 모바일 환경 등에서 이미지 생성을 원하시는 분들을 위해,
SD15 환경이 중요해질 수 있으므로, 주로 고해상도화를 추진하는 시도입니다.
과거 SD15가 등장했을 때와 다른 현재의 학습 기법 등을 적용해 SD15를 업데이트합니다.
이 시도에 동의하시는 분들은ぜひ "좋아요" 등으로 협력해 주세요.
학습에 협력해 주시는 분들은 학습 개요를 참조하여 LoRA 등 제작해 주세요.
EmoVAE에 대해서는 우선 https://civitai.com/posts/23602506를 확인해 주세요.
시각적으로 560000VAE와 840000VAE의 장점을 조합한 중간 형태라고 생각됩니다.
확대하여 확인해 보시기 바랍니다: 밝은 영역은 56에 가깝고, 어두운 영역은 84에 가까우며, 색역이 확장되었습니다.
화면 왼쪽 책장의 흰색 부분에 있는 글자처럼 보이는 부분을 비교해 보세요.
56VAE는 글자처럼 보이는 부분이 희미하게 사라지지만, EmoVAE 및 84VAE는 미세한 세부사항을 유지합니다.
화면 오른쪽 하단 침대 또는 소파 옆면의 무늬처럼 보이는 부분도 주목해 주세요.
84VAE는 회색이 강해 무늬가 사라지기 시작하지만, EmoVAE 및 56VAE는 미세한 세부사항을 유지합니다.
이처럼 각 VAE에 장단점이 있으므로, 이후에는 개인의 취향에 따라 VAE를 선택하시면 됩니다.











