d3caricature

세부 정보

파일 다운로드

모델 설명

큰 귀, 낮은 이마, 두드러진 코 및 과장된 얼굴 표현을 가진 캐릭터를 만들고 싶으신가요? 그게 바로 d3caricature가 목표로 하는 것입니다!

이것은 저의 Stable Diffusion을 위한 첫 번째 임베딩(Textual Inversion 영원히!) 시도이며, 지난 한 달간 가파른 학습 곡선을 거쳐 얻어진 결과입니다.

“바닐라” Stable Diffusion 2.1 768과 호환되며, 여러 다른 2.1 모델에서도 작동합니다. 동물에는 거의 영향을 주지 않으며, 오직 사람에게만 적용되며, 많은 경우 극단적인 결과를 만들어냅니다.

***

따라서 이 임베딩의 세 가지 버전을 포함했습니다:

d3caricature-beta-x - 1개 벡터를 균등 분포한 버전 (가장 낮은 영향)
d3caricature-beta-y - 6개 벡터의 “반 가중치” 균등 분포 버전 (중간 영향)
d3caricature-beta-z - 6개 벡터의 완전한 균등 분포 버전 (높은 영향)

프롬프트의 시작, 중간, 끝에 사용해 보고, 가중치를 높이거나 낮추거나, CFG 값을 조정해 실험해 보세요.

이 임베딩은 stable-diffusion-2.1-768로 충분히 테스트되었으나, perpetualDiffusion10_v10Moon(및 sun) 및 illuminatiDiffusionV1_v11 같은 다른 2.1 모델과 함께 사용하는 것을 강력히 권장합니다.

***

이 임베딩의 모든 버전은 68장의 수작업으로 선정되고 미세 조정된 이미지로 구성된 동일한 학습 세트를 기반으로 합니다. 학습 과정은 다음과 같습니다:

  • 500스텝 @ lr 0.375-0.5 (웨이업이 있는 선형)
  • 1000스텝 @ lr 0.075-0.1 (웨이업이 있는 선형)
  • 1000스텝 @ lr 0.015-0.02 (웨이업이 있는 선형)
  • 2000스텝 @ lr 0.003-0.004 (선형)
  • 2500스텝 @ lr 0.0006-0.0008 (선형)
  • 2500스텝 @ lr 0.00016

모든 학습은 invokeai 2.3.5에서 4개의 gradient_accumulation_steps로 수행되었으며, 이후 a1111과 Embedding Inspector 확장을 사용하여 결합되었습니다.

***

이 임베딩이 유용하게 사용되시길 진심으로 바라며, 즐겁게 사용하시길 바랍니다! 이 임베딩은 베타 상태이며, “릴리즈 후보” 상태에 도달할지, 심지어 도달할지 기대하는지도 전혀 모릅니다.

단지 제가 놓을 수 없었던 아이디어를 단순히 구현하고 싶어서 만들었습니다 ;)

감사합니다, 즐겁게 사용하세요!

사랑을 담아

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.