Wan - Taker POV Fellatio - I2V
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
이 모델은 Nvidia A6000을 사용하여, 다양한 분석 성위치에서 촬영한 약 30개의 2초 길이 영상(24fps)을 사용해 Wan I2V 14B 720P 체크포인트를 기반으로 diffusion-pipe로 학습되었습니다.
일반적으로 T2V Wan 체크포인트를 사용해 학습하는 것이 일반적인 관행이라는 것을 알고 있지만, 이 데이터셋으로 T2V 및 I2V 모두를 사용할 경우 엄청나게 나쁜 결과가 나옵니다. 제 가설은 Wan이 이와 같은 행동에 대해 다른 행동들만큼 인식하지 못하기 때문인 것 같지만, 확신은 없습니다. 단지 T2V로 이 모델을 여러 번 학습해보았지만 성공하지 못했고, 다른 데이터셋으로 T2V를 사용할 때는 성공적이었다는 점은 분명합니다.
