Wan2.2_S2V_text to "mouth shape" video - Dual sampler version

下のリンクをクリックして、直接お試しください。効果が良ければ、ローカルにデプロイできます。

https://www.runninghub.ai/post/1967949618497597442/?inviteCode=sdhs0trb

ファン特典：登録で1000ポイント獲得、毎日ログインで100ポイント、4090をプレイ！48Gの超パワーを体験してください。

テスト結果に基づくと、S2Vのリップシンク動画は、リップシンクが必要で、アクションとセリフの両方が求められる状況にのみ適しています。非人物動画の生成は推奨されず、音声はボーカル音楽または純粋なボーカルを使用することをお勧めします。5秒の音声の前2秒が純粋なボーカルで、後3秒がバックグラウンドミュージックの場合は、干渉が発生しやすくなります。

ローカルデプロイに必要なモデル：

Wan2.2 T2V high（ファイル名：wan2.2_t2w_high_noise_14B_fp16.safetensors）
https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
配置フォルダ：models\diffusionmodels
Wan2.2 S2V（ファイル名：wan2.2_st2v5_14B-bf16.safetensors）
https://hf-mirror.com/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models
配置フォルダ：models\diffusionmodels
wav2vec2_large_english_fp16
https://hf-mirror.com/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/audio_encoders
配置フォルダ：models\audio_coders

注意：
WanSoundImageToVideo エラー：プラグインのバージョンを更新してください。
AudioSeparation エラー：削除して再インストールしてください。

モデルタイプ	ワークフロー
ベースモデル	Wan Video 2.2 T2V-A14B
公開日	10/16/2025

Wan2.2_S2V_text to "mouth shape" video - Dual sampler version

詳細

ファイルをダウンロード

モデル説明

このモデルで生成された画像