Wan2.2_S2V_text to "mouth shape" video - Dual sampler version

详情

模型描述

您可以点击下方链接直接试用。如果效果良好,您可以部署到本地。

https://www.runninghub.ai/post/1967949618497597442/?inviteCode=sdhs0trb

粉丝福利,注册即可领取1000积分,每日登录100积分,畅玩4090!体验48G的超强性能。

https://buymeacoffee.com/a592991299o

根据测试结果,S2V唇形同步视频仅适用于需要唇形同步且同时包含动作与对白的场景。不建议生成非人类视频,最好使用人声音乐或纯人声作为音频。如果5秒音频的前2秒为纯人声,后3秒为背景音乐,容易造成干扰。

本地部署需下载的模型:

  1. Wan2.2 T2V high(文件名:wan2.2_t2w_high_noise_14B_fp16.safetensors)
    https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
    存放文件夹:models\diffusionmodels

  2. Wan2.2 S2V(文件名:wan2.2_st2v5_14B-bf16.safetensors)
    https://hf-mirror.com/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
    存放文件夹:models\diffusionmodels

  3. wav2vec2_large_english_fp16
    https://hf-mirror.com/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/audio_encoders
    存放文件夹:models\audio_coders

注意:
WanSoundImageToVideo 出错,请更新插件版本。
AudioSeparation 出错,请删除后重新安装。

此模型生成的图像

未找到图像。