WhiteXL_realisticMix
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
모델 설명: 현재 실제 테스트 결과 안정성이 아직 부족하지만, 좋은 이미지를 생성할 수 있습니다. 이 모델은 LoRA 융합 베이스 모델로 학습된 것이 아니므로 제작 비용이 매우 큽니다. 좋아하신다면 별 다섯 개를 주시면 감사하겠습니다.
768 해상도의 대규모 데이터로 한 번 학습한 후, 1024 해상도의 소규모 데이터로 추가 학습했습니다.
따라서 출력 해상도에 엄격한 제한은 없으며, 이미지 집합에도 다양한 해상도가 있습니다. 최적의 해상도는 1280 이하이며, 768–1024 해상도로 출력하는 것을 추천합니다.
CFG는 4~6 사이로 조절해 주세요. XL의 베이스 적합도가 매우 높아 학습 후 CLIP이 과도하게 학습되기 쉽습니다. 따라서 CFG는 적절히 낮춰 주시기 바랍니다.
재생성 비율은 0.3~0.4로 조절해 주세요. 과도한 재생성은 캐릭터가 2.5D로 왜곡될 수 있습니다. 그 이유는 XL 자체 데이터량이 방대하기 때문에, 제가 사용한 학습량으로는 원래의 많은 개념을 완전히 제거할 수 없기 때문입니다.
사용 권장: 이 모델을 기반으로 실제 인간을 위한 LoRA를 추가 학습하시면, 작은 개념에서도 이미지 품질이 크게 향상됩니다.
학습 과정: 이 모델은 5만 장의 이미지로 약 100만 스텝을 학습한 후, 소규모 이미지 집합으로 여러 차례 추가 학습했습니다. 총 약 150만 스텝을 학습했습니다. 학습 시간이 너무 길고 하드웨어 비용이 너무 커 개인적으로 부담이 커서 조기에 학습을 종료했습니다. 이후 실비스XL V20_V20Bakedvae 모델의 15%와 SDXL_xxmix9realisticsdxl_v10의 10%를 혼합했습니다. 현재까지 관찰한 결과, 학습량은 여전히 기대에 훨씬 못 미치며, XL에 충분한 데이터로 '세척'을 하지 않으면 1.5의 실제 사진 수준의 안정성을 달성하기 매우 어렵습니다. 하지만 현재의 효과는 충분히 오랫동안 즐기기에 충분합니다.
향후 계획: XL의 학습 비용이 너무 높아, 사랑만으로는 지속이 어렵습니다. 따라서 이 모델은 단기적으로 이 버전 하나만 제공될 것입니다. 향후 저에게 재정적 여유가 생기거나 후원자가 있어 깊이 있는 학습 연구를 진행할 수 있게 되면, 계속 업데이트하겠습니다. 가정 형편이 어려워 이해해 주시기 바랍니다(물론 후원해 주실 분이 계시다면 언제든지 연락주세요).
Bilibili ID: 주술사 노백













