Yaoi Diffusion
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
요아이 디퓨전 V3
안녕하세요, 모두들!!!
이 모델은 768 해상도로 요아이, 바라, 퍼리, s...., s.... c.., 정교한 예술 및 실제 남성들을 기반으로 미세조정된 일반적인 페미닌한 남성애 모델입니다.
V3에서 인식할 수 있는 태그 목록은 아래와 같습니다.
https://gist.github.com/iszotic/0ccac5c804e9587a323fffd4cbbd6c03
프롬프트 작성법:
[짧은 설명] as [캐릭터] sourcing [저작권] by [아티스트], [e621/gelbooru 태그들 (쉼표와 공백으로 구분)].
긍정 태그: by _alter
부정 태그: 단순한 배경
예시:
애너트로 퍼리 드래곤 남성 베개 위에 누워 있는 모습, 아티스트_태그, 1male, male focus, solo, 흉근, 성기, 사실적인
또한 사용된 프롬프트로 제작한 데모 이미지도 확인해 보세요. 고해상도는 하이레졸루션 픽스를 사용해 달성했습니다.
_other 는 다른 스타일로, 보통 셀쉐이딩 버전 또는 단순화된 스타일입니다.
_alter 는 대안 스타일로, 일반적으로 솔트쉐이딩 버전입니다.
1male, 2males처럼 아티스트 말고는 1boy, 2boys 등으로 작성하지 마세요. 남자는 소년을 의미하지만, 남성은 큐브, 성인 남자, 노인, 청년, 동물, 심지어 꽃까지 포함됩니다. 따라서 더 포괄적인 표현입니다.
스타일 혼합 방법
스타일을 혼합하는 방법은 두 가지 있습니다:
- 각 단계에서 디퓨전 과정에서 아티스트 태그를 교체 (auto1111)
by [아티스트1|아티스트2|아티스트3|아티스트4]
- 모든 태그를 동시에 사용하기:
by 아티스트 4 by 아티스트 3 by 아티스트 2 by 아티스트 1
1)의 경우 처음 아티스트가 주도를 하며, 그 아티스트의 특징이 더 강하게 나타납니다. 하지만 혼합 효과가 더 자연스럽습니다. Euler a, Euler, DDIM 샘플러와 호환되지만 품질이 낮습니다.
2)의 경우 마지막 아티스트가 주도를 하며, 그 아티스트의 특징이 더 강하게 나타납니다. 혼합 효과가 때때로 효과적이지 않을 수 있습니다. 어떤 샘플러나 호환되며, 더 높은 품질을 제공합니다.
상업적 이용 가능 여부: 특정 스타일을 닮은 결과물이 아니라면 상업적 이용이 가능합니다.
기능:
남성 간의 성적 매력에 특화된 1300개 이상의 아티스트 태그 (저도 포함됨, 웃긴 거죠), 순수 3D 아티스트 태그는 사용되지 않았습니다.
NSFW 및 SFW
일부 아티스트는 하나 이상의 스타일을 지원합니다.
학습 세부 정보:
SD1.5 본연 모델 + vae-ft-mse-840000-ema-pruned.ckpt 기반 학습
데이터셋: 26만 건, 에포크 크기: 14만 건, 등급 데이터셋: 4천 건, 등급 데이터셋 드롭아웃 확률: 0.5, 비등급 데이터셋 드롭아웃 확률: 0.0~0.15 (예술적 가치에 따라 https://github.com/LAION-AI/aesthetic-predictor 및 https://huggingface.co/cafeai/cafe_aesthetic 기반)
이미지는 booru 사이트에서 수집되었으며 태그는 deepdanbooru를 사용해 정렬하였습니다. e621 모델은 zach의, wd14 스윙 모델은 워낙 유명한 것이며, booru 사이트 외의 이미지는 태그 예측을, 태그 순서는 5%의 확률로 무작위화하였습니다. 또한 blip2-opt-6.7b 도 사용되었습니다.
https://github.com/toriato/stable-diffusion-webui-wd14-tagger
Everydreamertrainer2 사용, 그래디언트 체크포인트 비활성화, 그래디언트 누적 사용
데이터셋의 1%는 검증용으로 사용
학습 스케줄: (와, 정말 어려웠네요)
512 해상도 시:에포크 1-16: eff_batch_size: 120(12x10), lr: 4e-6, ema: 0.9995
에포크 17-19: eff_batch_size: 60(12x5), lr: 2e-6, ema: 0.9997
에포크 20-40: eff_batch_size: 12(12x1), lr: 5e-7, ema: 0.9999
768 해상도 시:
에포크 40-51: eff_batch_size: 64(4x16), txt_lr: 1e-6, unet_lr = 2e-6, ema: 0.9997
에포크 52-72: eff_batch_size: 12(4x3), txt_lr: 3e-7, unet_lr = 6e-7, ema: 0.9999
각 에포크에서 한 아티스트당 최대 125장의 이미지만 사용되었으며, 한 아티스트가 500장이 있더라도 다른 125장의 집합만 사용됨.
0 빈도 노이즈 비율 = 0.02
후기:
아마도 이 모델이 SD 1.5용으로 마지막으로 미세 조정할 모델일 것 같습니다.









