Wan2.2_S2V_text to "mouth shape" video - Dual sampler version

详情

模型描述

你可以点击下方链接直接试用。如果效果良好,你可以部署到本地。

https://www.runninghub.ai/post/1967887101318541313/?inviteCode=1cqzbf7a

粉丝福利:注册即得1000积分,每日登录100积分,畅玩4090!体验48G的超强算力。

根据测试结果,S2V唇形同步视频仅适用于需要唇形同步且同时包含动作与对白的场景。不建议生成非人类视频,最好使用人声音乐或纯人声作为音频。若5秒音频的前2秒为纯人声,后3秒为背景音乐,极易造成干扰。

本地部署需下载的模型:

  1. Wan2.2 T2V high(文件名:wan2.2_t2w_high_noise_14B_fp16.safetensors)
    https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
    放置文件夹:models\diffusionmodels

  2. Wan2.2 S2V(文件名:wan2.2_st2v5_14B-bf16.safetensors)
    https://hf-mirror.com/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
    放置文件夹:models\diffusionmodels

  3. wav2vec2_large_english_fp16
    https://hf-mirror.com/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/audio_encoders
    放置文件夹:models\audio_coders

注意:
WanSoundImageToVideo 出现错误,请更新插件版本。
AudioSeparation 出现错误,请删除并重新安装。

此模型生成的图像

未找到图像。