StablyDiffused's AniMagic
세부 정보
파일 다운로드
모델 설명
서론
와... 아무것도 업로드하지 않은 지 꽤 오래됐네요. 이 프로젝트를 오랫동안 진행해왔습니다. 수없이 많이 버려지고 다시 만들고, 이론을 재구성하고, 다시 건설했습니다. 사실 이건 버전 1.0이 아니어야 하지만, 제가 공개한 첫 번째 버전이므로... 이 모델의 목표는 매우 NSFW하면서도 RealCartoon-Pixar와 유사한 애니메이션 스타일을 지닌 것을 만드는 것이었습니다. RealCartoon-Pixar는 NSFW를 가능하게 하지만 완벽하지는 않습니다. 그 CLIP은 제가 모델이 구현하기를 원하는 더 거친 표현들을 잘 이해하지 못했기 때문이죠. 그러나 그 모델은 정말 멋진 미적 감각을 가지고 있고, 안타깝게도 이번 병합 과정에서 일부가 사라졌습니다. 하지만 이 병합 과정은 다양한 NSFW 모델(그리고 기타 일부 모델)을 결합해, 다양한 성적 포즈와 해부학적 정확성 등을 개선하면서도 좋은 배경 미학과 제가 모델에서 추구하는 섹시하고 유혹적인 스타일을 추가하려는 시도였습니다. 그런 후, 제 기반 모델의 CLIP과 WRAP16 프리셋을 사용한 MBW 병합을 통해 RealCartoon-Pixar의 외부 레이어를 추출하여 위에 덧붙였습니다. 완성! 작동했습니다. 여전히 개선하고 싶은 부분들이 몇 가지 있지만, 또 한 번 공개하지 말아야 할지 고민했습니다. 그러나 결국 이 모델을 공개하기로 결정했습니다. 왜냐하면 이 안에는 정말 훌륭한 요소들이 많기 때문이죠. 사용된 모든 모델은 아래에 명시되어 있습니다.
이 모델은 매우 NSFW 성향을 가지고 있습니다. 또한 피사체를 등 뒤로 돌리고 어깨 너머로 시선을 돌리며 엉덩이를 드러내는 포즈를 선호하는 경향이 있습니다(이 부분은 향후 버전에서 개선하고 싶습니다). 만약 이런 포즈를 원하지 않는다면, 피사체를 정면에서 보는 것을 유도하는 키워드를 프롬프트에 추가해야 합니다. 이 모델은 NSFW용으로 설계되었으며, NSFW 생성에 탁월하므로, 예시 이미지 대부분이 NSFW입니다. 그러나 모델이 NSFW 이상의 가능성을 갖추고 있음을 보여주기 위해 몇 개의 NSFW가 아닌 이미지도 포함했습니다.
면책 조항
예시 이미지의 모든 프롬프트는 InvokeAI 구문을 사용했으며, Automatic1111 구문이 아닙니다. 가장 중요한 점은 'term+'는 '(term)'과 동일하며, '++'는 '(())'과 동일하다는 것입니다. 모든 예시 이미지는 InvokeAI에서 xformers를 활성화한 상태로 생성되었습니다. InvokeAI는 이미지 생성 전에 모든 safetensors 또는 ckpt 파일을 diffusers 모델로 변환합니다. 따라서 예시 이미지를 1:1로 재현할 수 없을 가능성이 높습니다.
프롬프트 및 생성
스케줄러: Euler
스텝: 20 - 30
CFG: 8 - 12
CLIP Skip: 2
HiRes Fix를 사용할 경우 GFPGAN을 추천합니다. 4x 또는 Anime 버전이 잘 작동합니다. InvokeAI에서는 사용할 버전을 변경할 수 없지만, Auto1111에서 4x 버전을 테스트한 결과 꽤 잘 작동했습니다. Strength는 0.45를 추천합니다.
다음 TIs를 네거티브 프롬프트에 반드시 사용하는 것을 강력히 추천합니다. 제 모든 예시 이미지는 이 세 가지를 모두 사용했습니다.
EasyNegative와 BadHandv5도 시도해보았지만, 위 세 가지가 가장 좋은 결과를 주었습니다. 이 순서대로 사용하면 매우 잘 작동합니다.
제 프롬프트는 대체로 다음 형식으로 시작합니다. 그 뒤에 원하는 내용을 채우면 매우 잘 작동합니다:
양성 프롬프트: (masterpiece)+, (best quality)+, highres, high quality digital art of _____, high contrast, soft lighting, backlighting, bloom, light sparkles, chromatic aberration, smooth, sharp focus, (detailed)+, 4k, 8k uhd, (perfect anatomy)+, sharp, (intricate detail)+, (detailed background)+
음성 프롬프트: boring background, plain background, censored, (worst quality, low quality), greyscale, monocrome, multiple views, blurry, text, signature, <bad_quality>, <ng_deepnegative_v1_75t>, <negative_hand-neg>
눈: 눈이 흐릿하게 보인다면, 양성 프롬프트에 눈에 대한 언급을 꼭 포함하세요. '파란 눈, 세부적으로 묘사된 눈, 시청자 바라보기'와 같은 표현을 추가할 수 있으며, 원하는 눈색을 자유롭게 사용하세요.
VAE는 병합 과정에서 사용된 다른 모델 중 하나에서 유래된 내장된 VAE입니다. 정확히 어떤 VAE인지 모르겠지만, 색감이 생생하고 채도가 뛰어나 보이므로 걱정하지 않습니다. 툴킷에서는 SD v2 VAE로 표시됩니다.
이 모델은 Kojimbomber의 많은 LoRA와 매우 잘 어울리며, 몇 가지를 시도해보는 것을 추천합니다. 제 모든 예시 이미지에는 LoRA를 사용하지 않았으며, 위에서 언급한 TIs만 사용했습니다.




















