Wan2.2_S2V_text to "mouth shape" video - Dual sampler version

세부 정보

파일 다운로드

모델 설명

아래 링크를 클릭하여 직접 시험해 볼 수 있습니다. 효과가 좋다면 로컬에 배포할 수 있습니다.

https://www.runninghub.ai/post/1967887101318541313/?inviteCode=1cqzbf7a

팬 혜택: 등록 시 1000포인트 지급, 매일 로그인 시 100포인트, 4090으로 플레이! 48G의 초능력을 체험하세요.

테스트 결과에 따르면, S2V 립싱크 영상은 립싱크가 필요하고 동작과 대화가 모두 필요한 상황에만 적합합니다. 비인간 영상을 생성하는 것은 권장되지 않으며, 음성 음악이나 순수 보컬을 오디오로 사용하는 것이 가장 좋습니다. 5초 오디오의 앞부분 2초가 순수 보컬이고 뒷부분 3초가 배경 음악인 경우 간섭이 쉽게 발생할 수 있습니다.

로컬 배포에 필요한 모델 다운로드:

  1. Wan2.2 T2V high (파일명: wan2.2_t2w_high_noise_14B_fp16.safetensors)
    https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
    폴더 위치: models\diffusionmodels
  2. Wan2.2 S2V (파일명: wan2.2_st2v5_14B-bf16.safetensors)
    https://hf-mirror.com/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
    폴더 위치: models\diffusionmodels
  3. wav2vec2_large_english_fp16
    https://hf-mirror.com/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/audio_encoders
    폴더 위치: models\audio_coders

참고:
WanSoundImageToVideo 오류: 플러그인 버전을 업데이트하세요.
AudioSeparation 오류: 삭제 후 재설치하세요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.