Reveal Penis - Wan2.2 I2V
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
모든 현실적인 인물 이미지에 일반화된 벌거벗기기/등장하는 음경. 적어도 그게 아이디어다. 기본 모델에서 매우 높은 강도만 필요하다(음경을 더 잘 묘사하기 위해).
이것은 이미 음경을 묘사할 수 있는 혼합 모델에서 가장 잘 작동한다. 특히 이 모델은 최근 Civit에서 삭제되었지만, 나는 여기에 백업해 두었다: https://huggingface.co/TenStrip/Libidinous_Omega_Wan22mix-v2_backup/tree/main
최적 사용을 위한 간단한 가이드:
기본 트리거: 작은/큰 음경과 고환을 드러내다.
의류 제거/세팅(기본 트리거 앞에 오는 것):
[_underwear/shorts/panties_] 앞부분을 끌어올리고
[_pants/underwear/panties/shorts_]를 아래로 내리고
[_skirt/dress_]를 위로 끌어올리고
다리를 벌리고
앉은 채로 다리를 벌리며 숨겨진 음경과 고환을 드러내다
운동 설명(의류를 아래로 또는 위로 제거할 때):
단단한 음경이 위로 끌어올릴 때 걸려서 튀어나온다.
단단한 음경이 아래로 내릴 때 걸려서 위로 튀어나온다.
각도:
아래에서.
측면에서.
뒤에서. 돌아선다.
카메라를 아래로 기울인다.
후속 동작:
음경을 만지고 움직인다.
음경을 잡고 쓰다듬는다.
단단한 음경을 잡고 쓰다듬는다.
그리고 엉덩이를 흔들며 음경을 양쪽으로 흔든다.
큰/작음 외의 음경 묘사(완전히 신뢰할 수는 없음):
음경에 포피가 있다.
음경은 휴식 상태이며 작다.
아래를 향한 음경.
위로 휘어진 음경.
단단함
푸석푸석함
부드러움
단단함
나는 wan 캡셔닝에 경험이 없기 때문에, 모호하게 표현하면 he/she/it 및 기타 설명을 혼합할 수 있을 것이라 가정했다. 나는 전체 데이터셋에서 오직 이 문구들과 설명들만 사용했다. 더 많은 문구로 편집하는 것이 더 나을 수 있지만, 실제로 가장 좋은 결과는 이 영어가 부자연스러운 문구들을 그대로 복사할 때 얻어진다. 마치 긴 키워드처럼 작동하는 것 같다. 진정한 결과는 shift, 차원(더 큰 것이 더 나음), LTX LoRA, 모델 및 시작 이미지에 달려 있다.
이것은 2.2 모션 LoRA에 대한 내 첫 시도다. 이 버전은 가끔 이상하게 동작한다? 나는 보통 2.0 또는 2.5에서 사용하는 일반적인 rank64 i2v LightX LoRA를 1.0으로 줄이면 훨씬 더 나은 결과를 얻었다. 1030/1022 LightX LoRA에서는 더 나쁜 결과를 얻었다. 그들로는 음경이 보통 세부 사항이 부족해 보였다. 가장 좋은 결과는 smoothmix 같은 병합/훈련된 wan 모델에서 나온다.
나는 이 기능이 이미 널리 사용되고 있을 것이라 생각하며 조용히 기다렸다. 그러다 RunPod에서 직접 구현하면서 Zimage 관련 작업을 위해 ai-toolkit을 확인했다. 다음 번에 고칠 몇 가지 실수를 이미 발견했다: 10초 클립 하나를 남겨두었는데(때로는 움직임이 떨림을 일으킴), 음경 상단부에 대한 POV=low 지식이 부족했고, 완전히 femboy/trans에 집중되어 있었음(남성적인 남성도 여전히 작동해야 함). 그리고 솔직히 1024x 데이터셋은 대부분의 사용자에게 과도할 수 있다. 이걸로 음경의 전체 1080p 클로즈업을 생성할 수 있다.
더 많은 것을 원하거나 v2를 기다릴 수 없다면, 여기에 어떤 기여도 바로 훈련에 사용된다. 나는 더 많은 아이디어와 데이터셋을 가지고 있다:
기술적으로 이것은 v1.1이다. 처음으로 512x--256x 데이터셋을 rank 32로 시도했을 때 해부학적 세부 사항을 전혀 포착하지 못하고 오직 움직임만 잡아냈다. 이 버전은 rank 64로 구성되어 있지만, 정확한 움직임과 세부 사항이 필수적이다.
