ComfyUI beginner friendly WAN 2.2 Image-to-Video with Audio GGUF Workflow by SarcasticTOFU

これは、単一の入力画像と対応するオーディオクリップとともに、単一のWAN 2.2 S2V GGUFモデル（オーディオクリップを用いて動画をエンコードするための新しいWAN 2.2モデル）で動作する、非常にシンプルでComfyUI初心者向けの画像から動画へのワークフローです。このワークフローはシンプルで高速なので、比較的安価なGPU（12GB/16GBのNvidiaまたはRadeon GPU、またはいくつかのより手頃なApple Silicon Mac）でも、システムリソースの効率を向上させながらWAN 2.2を実行できます。（ComfyUIマネージャーとLORAマネージャープラグインをインストールして、チェックポイント、LORA、その他のリソースを簡単にダウンロード・管理することをお勧めします。これら2つはこのワークフローに役立つだけでなく、他のあらゆるケースでも大いに役立ちます。）必要なWAN 2.2 S2Vファイルをダウンロードするには、Hugging Faceのアカウントが必要です（詳細は以下に記載）。ComfyUIマネージャーを使ってComfyUIにGGUFアドオンをインストールし、正しいファイルを正しい場所に配置してください。また、私の他のワークフロー（SD 1.5 + SDXL 1.0、WAN 2.1、WAN 2.2 All-in-One、Chroma、QWEN、HiDream、Flux）もご確認ください。

使い方：

#1. まず、希望するWAN 2.2 S2V GGUFモデルとその他の必要なモデルを選択してください。

#2. 次に、画像から動画を生成するための入力画像と対応するオーディオクリップを選択してください。

#3. 次に、ポジティブプロンプトとネガティブプロンプトを入力してください。

#4. バッチ設定を選択してください（このセクションの注意事項に従ってください）および生成する動画の数を指定してください（「Run」ボタン横の数字を変更してください）。

#5. 最後に、「Run」ボタンを押して生成を開始してください。これで完了です。

*** Stability Matrixで管理されているComfyUIをご使用の場合は、オーディオエンコーダーをComfyUIパッケージのmodelsサブフォルダー内にダウンロードして配置してください（Stability Matrixの共通modelsサブフォルダーではありません）。つまり、<あなたのStability MatrixのDataフォルダー>/Packages/ComfyUI/models/audio_encoders に配置し、<あなたのStability MatrixのDataフォルダー>/Models/audio_encoders（ComfyUI、WebUI Forge、SD.Next など、Stability Matrixでインストール・管理する複数のツールで共有される共通モデルサブフォルダー）には配置しないでください。この手順を正しく行わないと、このワークフローは動作しません。

お楽しみください！

### このワークフローを使用するには、Hugging Faceにログインして必要なファイルをダウンロードする必要があります（アーカイブ内にワークフローファイルとともにテキストファイルも同梱しており、そこには私の他のワークフローに必要な追加のダウンロードリンクも記載されています）：

## WAN 2.2 モデル

===============================================================================================================

### WAN 2.2 S2V チェックポイントのダウンロードリンク

https://huggingface.co/QuantStack/Wan2.2-S2V-14B-GGUF/resolve/main/Wan2.2-S2V-14B-Q2_K.gguf

### WAN 2.2 エンコーダーのダウンロードリンク

https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/blob/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors

### WAN 2.1 VAE のダウンロードリンク（WAN 2.2 S2V モデルはWAN 2.1 VAEを使用します）

https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors

### WAN 2.2 Image-to-Video Lightning LoRA（S2V用）のダウンロードリンク

https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/resolve/main/split_files/loras/wan2.2_t2v_lightx2v_4steps_lora_v1.1_high_noise.safetensors

### WAN 2.2 Image-to-Video オーディオエンコーダー（S2V用）のダウンロードリンク

https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/resolve/main/split_files/audio_encoders/wav2vec2_large_english_fp16.safetensors

モデルタイプ	ワークフロー
ベースモデル	Wan Video 2.2 I2V-A14B
公開日	11/20/2025

ComfyUI beginner friendly WAN 2.2 Image-to-Video with Audio GGUF Workflow by SarcasticTOFU

詳細

ファイルをダウンロード

モデル説明

このモデルで生成された画像