hyperfusion SDXL DoRA 600k images
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
이 DoRA는 60만 장의 초대형 애니메이션 캐릭터 이미지를 기반으로 학습되었습니다. 주로 가슴/엉덩이/복부/허벅지/체지방에 초점을 맞춥니다. 이 데이터셋은 더 큰 Hyperfusion 데이터셋의 하위 집합이지만, 신체 형상/크기 관련 이미지만 필터링하여 구성되었습니다. 전체 데이터셋을 SDXL로 학습시키려면 1년 이상이 걸렸을 것입니다, lol.
권장 사항:
Dora/LoRA 강도: 1.0 (이제 대부분의 WebUI에서 DoRA가 작동합니다)
해상도: ~1024px
샘플러: PonyXL이 지원하는 모든 샘플러
v10에서는 v9보다 LoRA 가중치를 더 높게 설정할 수 있으므로, 개념이 원하는 대로 작동하지 않는다면 이를 증가시켜보세요.
Hyperfusion에서 사용된 140만 개의 사용자 정의 태그를 아래 링크에 업로드했습니다. 자신의 데이터셋에 통합하시기 바랍니다: https://huggingface.co/datasets/thojm/hyperfusion_classified_tags_export
v10 Noob_vpred 릴리스 2025/07/29:
여러분은 제가 사라졌다고 생각하셨나요? 아니요, 단지 텍스트 인코더를 고정한 채로 7개월 동안 모델을 학습시켰을 뿐입니다.
이 새로운 DoRA는 지금까지 익숙했던 개념들을 그대로 유지하고 있으며, 일반적으로 몇 가지 새로운 개념이 추가되었습니다. 또한 v9보다 20만 장 더 많은 이미지를 사용하여 학습했습니다.
이 버전은 NoobAI_Vpred로 학습되었기 때문에 다른 모델에서는 작동하지 않을 수도 있습니다. 특히 v_pred가 아닌 모델에서는 절대 작동하지 않습니다.
텍스트 인코더를 최종으로 고정한 채로 학습해보고 싶었습니다. 그리고 얼마나 오래 걸리든 이 방식을 고수하기로 결정했습니다. 이제 확실히 말할 수 있습니다. 향후 모델에서는 시간 절약을 위해 텍스트 인코더를 포함할 것입니다. 작동은 하지만 제 환경에서는 너무 느립니다.
새로운 개념 몇 가지를 포함한 새 태그 목록을 만들 때까지, 현재는 v9의 태그 목록을 사용하세요.
이 버전은 v9_sdxl보다 개념을 조금 더 잘 처리하며, 기울기 폭발 현상에도 덜 취약합니다.
v9 Pony 릴리스:
이 모델은 2개월 이상 학습되었지만, Flux가 출시되면서 GPU를 확보하기 위해 지금까지 학습된 결과를 공개하기로 결정했습니다. 기술적으로는 더 길게 학습시켜야 했지만, 저는 성급하고, 여러분 중 일부도 아마도 기다리기에 지쳤을 것입니다.
태그는 SD1용 마지막 v8 릴리스와 거의 동일하며, blob 콘텐츠 같은 몇 가지 새로운 항목이 추가되었습니다. 자세한 내용은 "Training Data" 섹션의 tag.csv를 참조하세요.
Pony는 학습하기가 약간 까다롭기 때문에, 이 모델로 많은 실험을 진행했습니다. 따라서 DoRA 강도를 1.0 부근으로 유지하는 것이 좋습니다. 1.1 이상으로 올리면 폭발할 가능성이 높습니다. (Pony 학습 시에는 scale_weight_norms 같은 가중치 정규화가 매우 중요합니다.)
학습 시간을 합리적으로 유지하기 위해 초기에는 768x768 해상도로 학습했고, 나중에 1024px 해상도로 학습을 마무리할 계획이었지만, Flux가 발생했습니다. 결과는 여전히 합리적으로 보입니다.
가끔 계획과 진행 상황을 여기에 업로드합니다.










