Pen-Gesture
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
안녕하세요, 이 모델은 illustriousXL에서 부족하게 인식된 태그("penetration_gesture")를 사용하여 이미지를 생성할 때 도움을 주기 위해 개발되었습니다.
다른 사용자가 동일한 목적을 위해 최근에 업로드한 LoRA가 있었지만, 개인적으로 너무 불안정하다고 느껴 직접 학습해보았고, 이제 여기에 결과물을 공유합니다.
버전을 논의하기 전에, LoRA를 몇 가지 핵심 포인트로 요약해드리겠습니다.
작동하나요? 네, 작동합니다.
안정적인가요? 네, 좋은 결과를 얻기 위해 최소한의 조정만으로도 충분합니다.
왜 다른 LoRA가 아닌 이걸 사용해야 하나요? 현재 작성 시점에서 illustriousXL용으로 이 제스처를 구현하려는 LoRA는 단 하나뿐입니다. 하지만 제 견해로는 이 LoRA가 더 안정적이고 더 유연합니다.
프리뷰 및 버전 섹션에 나와 있는 결과를 얻으려면 어떻게 해야 하나요? 제안된 프롬프트/설정과 유사한 방식을 사용하시면 됩니다.
이 모델이 마음에 드는데 어떻게 도움을 줄 수 있나요? 제 작업이 제가 admit하고 싶은 것보다 훨씬 더 많은 노력을 요구했지만, 좋아해주신다면 리뷰를 남기고, 자신의 생성물을 업로드하여 친구들과 공유해주세요.
대부분의 사용 팁은 버전 섹션에 나와 있지만, 더 많은 트릭, 팁 및 정보를 알고 싶다면 아래 섹션을 참고해주세요.
Pen-Gesture (v1)
이 버전은 "penetration_gesture" 태그를 사용하는 이미지 생성을 돕기 위해 개발되었습니다. 안타깝게도 illustriousXL은 이 태그를 잘 이해하지 못해 종종 다른 제스처(예: "kitsune no mado")를 생성하거나, 심지어 두 단어를 분리하여 NSFW 아트워크를 만들어내는 경우가 많습니다.
v1은 이 문제를 해결할 수 있으며, 제가 상상했던 결과는 아니었지만 매우 잘 작동합니다.
원래 계획은 "penetration_gesture" 태그를 두 개의 다른 태그 "lefthandp3n"과 "righthandp3n"으로 대체하여 더욱 정밀한 출력을 얻는 것이었습니다.
그러나 이 계획은 단지 80장의 이미지로 구성된 데이터셋만으로는 근접한 두 개념을 분리하여 각각의 키워드를 학습시키기에 부족했기 때문에 실패했습니다. 그러나 우리는 목표를 달성했습니다. 이제 LoRA는 이 제스처를 완전히 이해합니다.
LoRA 미사용 vs LoRA 사용
LoRA가 효과적으로 작동하는 것을 볼 수 있습니다(전반적으로 플러그 앤 플레이에 가깝습니다). 그러나 손 관련 요소들은 항상 그렇듯, 약간의 조정이 필요할 수 있습니다.
대부분의 테스트는 Hassaku (Illustrious)를 사용했고, 일부는 WAI-NSFW-illustrious-SDXL.를 사용했습니다.
저가 자주 사용한 설정은 다음과 같습니다:
Sampler: Euler A
Steps: ~28 ~32
CFG: ~6 ~6.4
이미지는 최종 결과를 더욱 향상시키기 위해 Upscaler 및 adetailer로 처리되었습니다.
Upscaler: YandereNeoXL_200k
steps:15
denoising:0.3
Adetailer:
face
fulleyesdetection
참고: adetailer는 손의 결과를 보완하기 위해 사용되지 않았습니다 <- 따라서 이 제스처의 결과는 100% LoRA의 성과입니다.
저가 따랐던 프롬프트 구조는 다음과 같습니다:
{당신의 프롬프트}, righthandp3n, lefthandp3n <lora:Handp3n:1>
네, 두 키워드 모두 사용하셔야 합니다.
그렇다면 사용 방법은 다음과 같습니다:
활성화 키워드: righthandp3n, lefthandp3n
LoRA 가중치: ~1 (1이 최적의 값입니다)
저는 종종 부정 프롬프트에 "(fewer digits, extra digits, 4 fingers, 6 fingers)"를 추가했습니다. (솔직히 말해, 이건 다른 사용자의 LoRA를 실험할 때 남겨둔 것입니다. 엄밀히 필요한지 확신이 없으므로 언급해드립니다.)
참고: CFG 및 스텝에 따라 출력 결과가 크게 달라질 수 있으므로, 원하는 이미지를 얻었지만 6개의 손가락이 나왔다면 CFG와 스텝을 약간 조정해보세요. 1~2회 시도로 원하는 결과를 얻을 수 있습니다.
일반적으로 저는 스텝을 28, CFG를 6으로 유지한 후 다음을 시도합니다:
먼저 동일한 시드로 스텝을 30으로 변경해봅니다. 그 후에도 원하는 결과가 나오지 않으면 CFG를 6.2 또는 6.4로 올립니다. <- 대부분의 경우 이 정도로 충분합니다.
충분히 테스트했나요? 제 GPU는 프라이팬으로 사용하기에 훌륭한 선택이었죠 xd.
첫 번째 테스트는 해상도 832*1216에서 진행되었으며, 위에 보여드린 이미지입니다.
참고: 두 제안된 이미지 간의 유일한 차이점은 LoRA와 두 활성화 키워드의 존재 여부입니다.
두 번째 테스트 (896*1152):

세 번째 테스트 (768*1344):

네 번째 테스트 (1024*1024):

다섯 번째 테스트 (1216*832):

여섯 번째 테스트 (1152*896):

일곱 번째 테스트 (1344*768):

마지막이자 가장 중요한 테스트는 기존 캐릭터에 대한 테스트였습니다. 이를 위해 Fairy Tail 캐릭터를 사용해 몇 가지 이미지를 생성해보았습니다 (간단히 설명하자면, 동일한 프롬프트를 사용하고 캐릭터만 바꾸었습니다):

추가 참고 사항:
- 가로 해상도를 사용할 때, 이 모델은 넓은 이미지로 학습되지 않았기 때문에 이러한 해상도에서 어려움을 겪을 수 있습니다(도움을 받기 위해 "multiple_views" 같은 태그를 부정 프롬프트에 포함하여 "before/after" 같은 이미지 생성을 방지하세요).
프롬프트 작성 시 데이터셋이 꽤 균형 잡혀 있었지만, "검은 청색 머리카락" 이미지는 전혀 없었기 때문에(일부 시드와 프롬프트에 따라) 1152*896 테스트에서처럼 머리카락 색이 "연한 청색"으로 나올 수 있습니다.
이 모든 내용을 읽어주셔서 진심으로 감사합니다(저는 말이 많고 불필요한 세부 정보를 너무 많이 제공하는 편이라는 것을 알고 있습니다). 이 LoRA를 즐기시고, 제 다음 모델에서도 뵙기를 바랍니다.




















