Reveal Penis - Wan2.2 I2V

세부 정보

모델 설명

모든 현실적인 인물 이미지에 일반화된 벌거벗기기/등장하는 음경. 적어도 그게 아이디어다. 기본 모델에서 매우 높은 강도만 필요하다(음경을 더 잘 묘사하기 위해).

이것은 이미 음경을 묘사할 수 있는 혼합 모델에서 가장 잘 작동한다. 특히 이 모델은 최근 Civit에서 삭제되었지만, 나는 여기에 백업해 두었다: https://huggingface.co/TenStrip/Libidinous_Omega_Wan22mix-v2_backup/tree/main

최적 사용을 위한 간단한 가이드:

기본 트리거: 작은/큰 음경과 고환을 드러내다.

의류 제거/세팅(기본 트리거 앞에 오는 것):

[_underwear/shorts/panties_] 앞부분을 끌어올리고

[_pants/underwear/panties/shorts_]를 아래로 내리고

[_skirt/dress_]를 위로 끌어올리고

다리를 벌리고

앉은 채로 다리를 벌리며 숨겨진 음경과 고환을 드러내다

운동 설명(의류를 아래로 또는 위로 제거할 때):

단단한 음경이 위로 끌어올릴 때 걸려서 튀어나온다.

단단한 음경이 아래로 내릴 때 걸려서 위로 튀어나온다.

각도:

아래에서.

측면에서.

뒤에서. 돌아선다.

카메라를 아래로 기울인다.

후속 동작:

음경을 만지고 움직인다.

음경을 잡고 쓰다듬는다.

단단한 음경을 잡고 쓰다듬는다.

그리고 엉덩이를 흔들며 음경을 양쪽으로 흔든다.

큰/작음 외의 음경 묘사(완전히 신뢰할 수는 없음):

음경에 포피가 있다.

음경은 휴식 상태이며 작다.

아래를 향한 음경.

위로 휘어진 음경.

단단함

푸석푸석함

부드러움

단단함

나는 wan 캡셔닝에 경험이 없기 때문에, 모호하게 표현하면 he/she/it 및 기타 설명을 혼합할 수 있을 것이라 가정했다. 나는 전체 데이터셋에서 오직 이 문구들과 설명들만 사용했다. 더 많은 문구로 편집하는 것이 더 나을 수 있지만, 실제로 가장 좋은 결과는 이 영어가 부자연스러운 문구들을 그대로 복사할 때 얻어진다. 마치 긴 키워드처럼 작동하는 것 같다. 진정한 결과는 shift, 차원(더 큰 것이 더 나음), LTX LoRA, 모델 및 시작 이미지에 달려 있다.

이것은 2.2 모션 LoRA에 대한 내 첫 시도다. 이 버전은 가끔 이상하게 동작한다? 나는 보통 2.0 또는 2.5에서 사용하는 일반적인 rank64 i2v LightX LoRA를 1.0으로 줄이면 훨씬 더 나은 결과를 얻었다. 1030/1022 LightX LoRA에서는 더 나쁜 결과를 얻었다. 그들로는 음경이 보통 세부 사항이 부족해 보였다. 가장 좋은 결과는 smoothmix 같은 병합/훈련된 wan 모델에서 나온다.

나는 이 기능이 이미 널리 사용되고 있을 것이라 생각하며 조용히 기다렸다. 그러다 RunPod에서 직접 구현하면서 Zimage 관련 작업을 위해 ai-toolkit을 확인했다. 다음 번에 고칠 몇 가지 실수를 이미 발견했다: 10초 클립 하나를 남겨두었는데(때로는 움직임이 떨림을 일으킴), 음경 상단부에 대한 POV=low 지식이 부족했고, 완전히 femboy/trans에 집중되어 있었음(남성적인 남성도 여전히 작동해야 함). 그리고 솔직히 1024x 데이터셋은 대부분의 사용자에게 과도할 수 있다. 이걸로 음경의 전체 1080p 클로즈업을 생성할 수 있다.

더 많은 것을 원하거나 v2를 기다릴 수 없다면, 여기에 어떤 기여도 바로 훈련에 사용된다. 나는 더 많은 아이디어와 데이터셋을 가지고 있다:

https://ko-fi.com/tenstrip

기술적으로 이것은 v1.1이다. 처음으로 512x--256x 데이터셋을 rank 32로 시도했을 때 해부학적 세부 사항을 전혀 포착하지 못하고 오직 움직임만 잡아냈다. 이 버전은 rank 64로 구성되어 있지만, 정확한 움직임과 세부 사항이 필수적이다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.