Faputa - Made in Abyss

세부 정보

파일 다운로드

모델 설명

가치의 구현체.

사용 방법:

정확성보다는 그냥 춤추고 싶다면 프롬프트에 임베드 트리거를 추가하세요.

FPTA

정확한 캐릭터에 더 가깝게 원한다면 전체 프롬프트를 사용하세요.

(FPTA:1.1), (ears back, floppy ears:1.1), (dark-skinned female:1.2), very dark skin, (fluffy, fuzzy:1.2), (pink inner ear:1.2), (extra arms, 4 arms:1.2) (small nose:1.2), (monster girl:1.2), (thigh fur, leg fur, waist fur, hips fur:1.2), (white legs:1.4), (huge hips, huge thighs:1.1), multiple tails, outie navel

추가된 요소들은 주로 다양한 단점을 보완하기 위한 것이며, 솔직히 많은 부분을 제거할 수 있습니다(가중치는 CFG에 따라 조정 가능). 약간 더 높은 가중치를 주면 머리 위의 귀와 관련된 이상한 층화 현상이 약간 더 잘 조정되지만, 옷을 추가하면 금속 브라가 나타나는 부작용이 있습니다(나는 브라 없이도 버전을 훈련할 예정입니다).

세부 사항에 관심이 있다면

임베드는 꽤 가깝게 접근합니다(작은 임베드치고는 생각보다 훨씬 가깝죠), 하지만 일부 문제점이 존재합니다. 그럼에도 불구하고, 이 문제점들은 대부분 해당 캐릭터의 다른 LoRA에서도 나타나므로, 나는 이를 성공이라고 부릅니다. 게다가 이 임베드는 단지 300kb에 불과하니까요...

다리의 털이 허리까지 올라가는 경우와 그렇지 않은 경우가 랜덤합니다.

이건 거의 뽑기 수준이고, 내가 고칠 수 있는 문제는 아닙니다. 하지만 전체 프롬프트를 사용하면 약간 완화됩니다. 대부분은 심리적 효과일 뿐이죠...

추가 팔은 약 80%의 확률로 생성됩니다.

이것도 크게 개선할 수 없을 것 같습니다. 왜냐하면 사람들은 이미지 생성 모델이 추가 팔과 다리가 생성되지 않도록 오랜 시간 최적화해왔기 때문입니다. 그러나 생성될 때, 같은 자세로 두 배가 되는 대신 독립적으로 움직이는 모습을 보여줘서 정말 즐겁습니다. 정확히 4개의 팔이 나오는 건 뽑기입니다. 3개나 6개가 더 흔하며, 4개도 자주 나오죠.

귀가 세워지는 경우는 거의 없습니다.

트레이너에 입력한 모든 예시에서 귀는 아래로 처져 있었지만, 생성 과정에서 가끔 세워지는 현상이 발생합니다. 전체 프롬프트의 "floppy" 요소는 이를 막으려는 시도였고, 임베드의 가중치를 높이면 잘 수정됩니다. 하지만 애니메이션에서 캐릭터의 귀는 실제로 움직이므로, 완전히 망한 건 아닙니다.

발바닥과 기타 이상한 요소 가 가끔 나타납니다
이 캐릭터가 퓨리 특성과 가깝기 때문에 모델이 퓨리로 인식하는 듯해, 때때로 손에 발바닥이나 발톱 같은 게 생깁니다. 드물게 색상도 이상하게 나옵니다.

그럼에도 불구하고, 300MB 대비 300KB의 파일 크기라 사실상 무료입니다.

이제 방 안의 코끼리에 대해 이야기해봅시다...

"왜 임베드인가요? LoRA가 더 나은 게 아닙니까?"

제가 묻고 싶은 건, 정말로 그렇습니까? 정말로요??? LoRA에 대해 실제로 무엇을 알고 있나요? 임베드에 대해선 단지 오래된 학습 방법이고, 오래된 것 = 나쁘다는 것 외에는 뭘 알죠?

LoRA는 기존 모델에 새로운 개념을 도입하는 데 유용합니다. 그러나 약 75%의 경우, 대부분의 LoRA는 새로운 개념을 도입하는 게 아니라 이미 모델 내부에 존재하는 요소들일 뿐입니다. 그것이 바로 임베드가 모델에서 끌어내는 것들입니다.

하지만 당신은 말할 겁니다... "하지만 내 와이푸는 유일무이해요!!! 특별하죠!" 안타깝지만, 그녀는 아마 특별하지 않을 겁니다. 프롬프트만으로 캐릭터의 40~50% 정도 유사성을 얻을 수 있다면("그래, 그거 X랑 비슷하네!") 임베드가 나머지를 거의 다 해결해 줍니다. 임베드로 캐릭터를 꺼내는 건 마법이 아니라, 임베드가 잘하는 일입니다. 왜냐하면 당신의 와이푸를 이름으로 부르지 않더라도, 모델은 이미 다양한 와이푸의 모습을 매우 잘 이해하고 있기 때문입니다. 임베드는 단지 모델이 알고 있는 것을 어떻게 사용해서 당신의 와이푸를 생성할지 안내할 뿐입니다.

"하지만 개념은요! 제가 원하는 자세로 그녀를Fuck하는 걸 프롬프트로 표현할 수 없어요! 임베드로는 그런 포즈를 만들 수 없죠." 음... 아마도 가능할 겁니다. 모델 안에는 수많은 와이푸가 있고, 그녀들이 모든 방향으로 Fuck되는 장면도 똑같이 많습니다. 이전 규칙이 그대로 적용됩니다. 그 수십 GB 규모의 모델 안에는, 임베드를 훈련하면 원하는 행동을 유추할 수 있을 만큼 충분한 정보가 존재합니다.

옷, 표정, 카메라 앵글, 구도, 헤어스타일, 거의 모든 요소도 마찬가지입니다.

게다가, 임베드는 수백 MB가 아닌 수백 킬로바이트만 차지합니다. 물론 200MB짜리 LoRA 하나만 놓고 보면 크지 않지만, 정말로 쌓이면 심각한 문제입니다. VRAM에도 큰 부담이 됩니다. SDXL 모델 자체가 이미 무겁고, 그 위에 최적화되지 않고 잘못 훈련된 LoRA들을 겹치면 성능이 심각하게 저하됩니다. 게다가 잘못 훈련된 LoRA들은 유연하지 않고, 고정된 이상한 스타일이 내장되어 있어 바꿀 수조차 없습니다. 반면, 임베드는 동일 세대의 다양한 모델에서 더 유연하게 작동하며, LoRA는 일반적으로 훈련된 모델에만 제한됩니다.

"그럼 임베드가 이렇게 좋다면 LoRA는 뭐에 쓰는 거죠?"

앞서 말했듯, 모델에 새로운 개념을 도입하는 데 사용됩니다. 스타일이 좋은 예시입니다. 스타일은 LoRA가 새로운 정보로 모델을 부스팅하는 방식을 효과적으로 활용합니다. 인간은 잘 그리지만, 코끼리에 대해선 중세 스타일로만 표현하거나 태그 자체를 무시하는 모델이 있다면, LoRA가 잘 작동합니다. 왜냐하면 코끼리를 띄우기 위해 임베드로 강화할 만한 정보가 별로 없기 때문입니다. 임베드와 함께 사용하면 더욱 강화됩니다.

저는 LoRA를 싫어하지 않습니다. 오히려 반대로죠. 다만, 누군가 프롬프트로 표현할 수 없는 어떤 것도 전부 LoRA로 훈련하는 현상이 너무 흔해졌다는 게 싫을 뿐입니다. "내 와이푸가 특정한 식으로 웃기를 원해!" 그럼 500MB짜리 LoRA를 훈련해라! 3KB짜리 임베드로도 부작용 없이 충분히 가능한 걸 200MB 이상의 모델로 훈련하는 게 지금은 말도 안 되는 일입니다.

결국, 임베드에게 기회를 주세요, 잭.

제 광란의 테드토크에 참석해 주셔서 감사합니다.

임베드를 좋아하시길 바랍니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.