Wan2.2_S2V_text to "mouth shape" video - Dual sampler version

詳細

ファイルをダウンロード

モデル説明

下のリンクをクリックして、直接お試しください。効果が良ければ、ローカルにデプロイできます。

https://www.runninghub.ai/post/1967949618497597442/?inviteCode=sdhs0trb

ファン特典:登録で1000ポイント獲得、毎日ログインで100ポイント、4090をプレイ!48Gの超パワーを体験してください。

https://buymeacoffee.com/a592991299o

テスト結果に基づくと、S2Vのリップシンク動画は、リップシンクが必要で、アクションとセリフの両方が求められる状況にのみ適しています。非人物動画の生成は推奨されず、音声はボーカル音楽または純粋なボーカルを使用することをお勧めします。5秒の音声の前2秒が純粋なボーカルで、後3秒がバックグラウンドミュージックの場合は、干渉が発生しやすくなります。

ローカルデプロイに必要なモデル:

  1. Wan2.2 T2V high(ファイル名:wan2.2_t2w_high_noise_14B_fp16.safetensors)
    https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
    配置フォルダ:models\diffusionmodels

  2. Wan2.2 S2V(ファイル名:wan2.2_st2v5_14B-bf16.safetensors)
    https://hf-mirror.com/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
    配置フォルダ:models\diffusionmodels

  3. wav2vec2_large_english_fp16
    https://hf-mirror.com/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/audio_encoders
    配置フォルダ:models\audio_coders

注意:
WanSoundImageToVideo エラー:プラグインのバージョンを更新してください。
AudioSeparation エラー:削除して再インストールしてください。

このモデルで生成された画像

画像が見つかりません。