WAN 2.2 S2V Lipsync Workflow with SageAttention + BlockSwap + GGUF (include Upscale and Interpolation)

詳細

ファイルをダウンロード

モデル説明

私のTGチャンネル - https://t.me/StefanFalkokAI

私のTGチャット - https://t.me/+y4R5JybDZcFjMjFi

こんにちは!私はComfyUIでのWan 2.2 S2Vジェネレーション動画を作成するための作業フローを紹介します。

Wan 2.2 S2Vモデルが必要です。

Wan 2.2モデル(https://huggingface.co/Kijai/WanVideo_comfy_fp8_scaled/tree/main/S2V)、clip(https://huggingface.co/Kijai/WanVideo_comfy/blob/main/umt5-xxl-enc-bf16.safetensors)、audio_encoder(https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/audio_encoders)およびVAE(wan 2.1 VAE)が必要です。

GGUF - https://huggingface.co/QuantStack/Wan2.2-S2V-14B-GGUF/tree/main

また、より高速で高品質な生成のために、Lora https://huggingface.co/Kijai/WanVideo_comfy/tree/main/Lightx2v を含めました。

Loraの強度を1.5に設定すると、最良の結果が得られます。

さらに、より高速な生成にはSageattention 2.2.0(Triton対応)(https://huggingface.co/Kijai/PrecompiledWheels/tree/main)とTorch 2.7.0+(https://github.com/pytorch/pytorch/releases)が必要です。また、CUDA 12.8(https://developer.nvidia.com/cuda-12-8-0-download-archive)とVS Code(https://visualstudio.microsoft.com/downloads/)をダウンロードしてインストールする必要があります。

Sageattentionのインストール方法(1.0.6):Sageattention 2.2.0をインストールするには、.whlファイルを.zipにリネームし、.zipから抽出したフォルダをComfyUI\python_embeded\Lib\site-packagesに配置してください。

オーディオ、画像、プロンプトを入力して、お楽しみください!

作業フローで問題が発生した場合や、何か不具合を見つけた場合は、コメントをお寄せください。

このモデルで生成された画像

画像が見つかりません。