WAN 2.2 S2V Lipsync Workflow with SageAttention + BlockSwap + GGUF (include Upscale and Interpolation)
詳細
ファイルをダウンロード
モデル説明
こんにちは!ComfyUIでのWan 2.2 S2V生成ビデオの作業フローを紹介します。
Wan 2.2 S2Vモデルが必要です。
Wan 2.2モデル(https://huggingface.co/Kijai/WanVideo_comfy_fp8_scaled/tree/main/S2V)、CLIP(https://huggingface.co/Kijai/WanVideo_comfy/blob/main/umt5-xxl-enc-bf16.safetensors)、audio_encoder(https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/audio_encoders)、およびVAE(Wan 2.1 VAE)が必要です。
GGUF - https://huggingface.co/QuantStack/Wan2.2-S2V-14B-GGUF/tree/main
また、より高速で高品質な生成のために、LoRA https://huggingface.co/Kijai/WanVideo_comfy/tree/main/Lightx2v も含めています。
最高の結果を得るには、LoRAの強度を1.5に設定することをお勧めします。
さらに、より高速な生成にはSageattention 2.2.0(Triton対応)(https://huggingface.co/Kijai/PrecompiledWheels/tree/main) と Torch 2.7.0+(https://github.com/pytorch/pytorch/releases)が必要です。また、CUDA 12.8(https://developer.nvidia.com/cuda-12-8-0-download-archive)とVS Code(https://visualstudio.microsoft.com/downloads/)をダウンロードしてインストールする必要があります。
Sageattentionのインストール方法(1.0.6版、2.2.0版のインストール方法:.whlファイルを.zipにリネームし、.zip内のフォルダをComfyUI\python_embeded\Lib\site-packagesに配置)
オーディオ、画像を用意し、プロンプトを記入してお楽しみください!
作業フローに問題がある場合や困ったことがあれば、コメントをお寄せください。

