hyperfusion SDXL DoRA 600k images

세부 정보

모델 설명

이 DoRA는 60만 장의 초대형 애니메이션 캐릭터 이미지를 기반으로 학습되었습니다. 주로 가슴/엉덩이/복부/허벅지/체지방에 초점을 맞춥니다. 이 데이터셋은 더 큰 Hyperfusion 데이터셋의 하위 집합이지만, 신체 형상/크기 관련 이미지만 필터링하여 구성되었습니다. 전체 데이터셋을 SDXL로 학습시키려면 1년 이상이 걸렸을 것입니다, lol.

권장 사항:

  • Dora/LoRA 강도: 1.0 (이제 대부분의 WebUI에서 DoRA가 작동합니다)

  • 해상도: ~1024px

  • 샘플러: PonyXL이 지원하는 모든 샘플러

  • v10에서는 v9보다 LoRA 가중치를 더 높게 설정할 수 있으므로, 개념이 원하는 대로 작동하지 않는다면 이를 증가시켜보세요.

Hyperfusion에서 사용된 140만 개의 사용자 정의 태그를 아래 링크에 업로드했습니다. 자신의 데이터셋에 통합하시기 바랍니다: https://huggingface.co/datasets/thojm/hyperfusion_classified_tags_export

v10 Noob_vpred 릴리스 2025/07/29:

  • 여러분은 제가 사라졌다고 생각하셨나요? 아니요, 단지 텍스트 인코더를 고정한 채로 7개월 동안 모델을 학습시켰을 뿐입니다.

  • 이 새로운 DoRA는 지금까지 익숙했던 개념들을 그대로 유지하고 있으며, 일반적으로 몇 가지 새로운 개념이 추가되었습니다. 또한 v9보다 20만 장 더 많은 이미지를 사용하여 학습했습니다.

  • 이 버전은 NoobAI_Vpred로 학습되었기 때문에 다른 모델에서는 작동하지 않을 수도 있습니다. 특히 v_pred가 아닌 모델에서는 절대 작동하지 않습니다.

  • 텍스트 인코더를 최종으로 고정한 채로 학습해보고 싶었습니다. 그리고 얼마나 오래 걸리든 이 방식을 고수하기로 결정했습니다. 이제 확실히 말할 수 있습니다. 향후 모델에서는 시간 절약을 위해 텍스트 인코더를 포함할 것입니다. 작동은 하지만 제 환경에서는 너무 느립니다.

  • 새로운 개념 몇 가지를 포함한 새 태그 목록을 만들 때까지, 현재는 v9의 태그 목록을 사용하세요.

  • 이 버전은 v9_sdxl보다 개념을 조금 더 잘 처리하며, 기울기 폭발 현상에도 덜 취약합니다.

v9 Pony 릴리스:

  • 이 모델은 2개월 이상 학습되었지만, Flux가 출시되면서 GPU를 확보하기 위해 지금까지 학습된 결과를 공개하기로 결정했습니다. 기술적으로는 더 길게 학습시켜야 했지만, 저는 성급하고, 여러분 중 일부도 아마도 기다리기에 지쳤을 것입니다.

  • 태그는 SD1용 마지막 v8 릴리스와 거의 동일하며, blob 콘텐츠 같은 몇 가지 새로운 항목이 추가되었습니다. 자세한 내용은 "Training Data" 섹션의 tag.csv를 참조하세요.

  • Pony는 학습하기가 약간 까다롭기 때문에, 이 모델로 많은 실험을 진행했습니다. 따라서 DoRA 강도를 1.0 부근으로 유지하는 것이 좋습니다. 1.1 이상으로 올리면 폭발할 가능성이 높습니다. (Pony 학습 시에는 scale_weight_norms 같은 가중치 정규화가 매우 중요합니다.)

  • 학습 시간을 합리적으로 유지하기 위해 초기에는 768x768 해상도로 학습했고, 나중에 1024px 해상도로 학습을 마무리할 계획이었지만, Flux가 발생했습니다. 결과는 여전히 합리적으로 보입니다.

가끔 계획과 진행 상황을 여기에 업로드합니다.

변경 사항 기사 링크

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.