WAN 2.2 GGUF/start end frame/t2v/i2v 8gb/10 seconds to 4 minutes workflow
詳細
ファイルをダウンロード
モデル説明
WAN 2.2 – フレーム開始から終了までのシネマティックワークフロー(ラジアル/スパースセージアテンションパッチ付き)
バックループなしの超安定10秒動画
完全なWindowsガイド(Triton • SpargeAttn • RadialAttn)
実行環境要件:
Windows • Python 3.10–3.11 • RTX 4060 Ti 8GB 以上
ComfyUI バージョン: 0.3.6+
WAN バージョン: WAN 2.2 GGUF (VAC + CLIP) / ご希望のモデルに切り替えることができます
⭐ このワークフローの機能
このプロジェクトは、以下の特徴を持つ完全に安定した10秒動画を生成します:
ピンポン効果なし
フレーム崩壊なし
モーフィングアーチファクトなし
完全な開始→終了補間
フルワールドスペースモーション(ピクセルモーフィングではない)
高い時間的安定性
シネマティックなカメラ移動
オプション:フィルムVFIスローモーション
オプション:x4アップスケール+シャープネス
デフォルトのWANや標準的なサンプラーとは異なり、このバージョンは:
SparseSageAttn + RadialAttn
を使用して、WANのアテンションウィンドウを約80フレームから161フレーム以上に拡張します。
これにより、WANは完全な10秒間を一貫したシーンとしてレンダリング可能になります。
⭐ 機能
真の開始フレームから終了フレームまでのワールド構築
SD3「Shift」パラメータ(推奨:10秒クリップには50)
開始フレーム+終了フレームのサポート(24の完全制御シーン)
画像から動画、テキストから動画の両方に対応
スムーズなシネマティックな動き
フィルムグレイン、モヤ、モノクロ安定性
オプション:ClearReality x4 アップスケール
オプション:シャープネス処理
8GB GPUと互換性あり
🔧 インストール(Windows)
ステップ1 — Windows用 Triton のインストール
WAN 2.2 + RadialAttn には Triton が必要です。
正しいWindows用wheelをこちらからダウンロードしてください:
https://github.com/woct0rdho/triton-windows/releases
あなたのvenv内にインストールしてください。
ステップ2 — SparseSageAttn のインストール
Windows用wheelをこちらからダウンロードしてください:
https://github.com/woct0rdho/SpargeAttn/releases
あなたのvenv内にインストールしてください。
ステップ3 — RadialAttn ノードのインストール
こちらからダウンロードしてください:
https://github.com/woct0rdho/ComfyUI-RadialAttn
ComfyUIのcustom_nodesフォルダに配置してください。
ステップ4 — ComfyUI を再起動
Sparse / Radial Attn が正しく読み込まれると、起動ログに次のように表示されます:
“Using sparse_sage_attn as block_sparse_sage2_attn_cuda”
これでパッチが有効になります。
📸 ワークフローの動作原理
1. Shiftノード(SD3スタイルの条件付け)
SHIFTを増やすと、WANに次のように指示されます:
「時間経過とともにシーンを物理的に一貫性を持って維持してください。」
1秒あたりの推奨値:
SHIFT = 秒数 × 5
→ 10秒の場合:SHIFT = 50
これにより、全体のワールドモーションが安定します。
2. 開始フレームから終了フレームまでのサンプラー
以下のものを取り込みます:
開始フレーム(画像A)
終了フレーム(画像B)
そして、161フレームにわたる滑らかなワールドスペース補間を生成します。
アテンションパッチにより、WANの時間的メモリが拡張され、ピンポン効果が発生しなくなります。
3. FILM VFI(オプション)
有効にすると、FPSを滑らかに2倍または4倍に増加させます。
ベースラインレンダリング後に使用してください。
4. アップスケール(オプション)
- アップスケールモデル = ClearReality x4
⭐ 重要なヒント
8GB GPU向け:
VFIの後にアップスケールを実行
VRAMの過負荷を避けるためテスト中はアップスケールを無効にしてください(アップスケール+シャープネスをグループトグルで隠してください)
🎥 ワークフローの使い方
1. 開始画像と終了画像を読み込む
各シーンに1組(A → B)を使用してください。
2. シネマティックなプロンプトを入力
プロンプトの例:
「動画は霧のかかったドイツの森から始まる。カメラは泥だらけの小道に沿ってゆっくりと前進する。モーフィングは一切ない。これは連続した世界である。動画の最後には、カメラは放棄された村に到達し、同じシネマティックなモノクロスタイルを維持する。」
3. SHIFT = 50 を設定
(10秒用)
4. 開始→終了フレームをレンダリング
WANは161フレームの完全なモーションを直接生成します。
5. オプション:FILM VFIを有効にする
スローモーション/より滑らかな動きのために。例:WAN 2.2は16fpsでトレーニングされているため、VFI x2を設定して出力を32fpsに、VFI x4を設定して出力を64fpsにします。
6. オプション:アップスケール&シャープネスを有効にする
最大の明瞭さを得るために。
⭐ 設定に困ったら
この説明文全体をコピーしてChatGPTに貼り付け、次のように聞いてください:
「上記で説明されているWAN 2.2 開始フレームから終了フレームまでのワークフローを、Triton、SparseSageAttn、RadialAttn、SD3 SHIFT=50、デュアルKSampler、およびオプションのアップスケール/シャープネスのセクションを含めて、完全に再現したいです。
ComfyUIでこのワークフローをステップバイステップで再構築する手助けをしてください。」
すると、ChatGPTが手順をガイドしてくれます。
🏁 最終的な注意点
このワークフローは以下の用途に最適です:
シネマティックな移動撮影
ワールドビルディング
安定した長時間シーケンス
シーン間の物語展開
アーチファクトを最小限に抑え、一貫した動きを実現
SHIFT、開始→終了フレーム、アテンションパッチの組み合わせが、ループなしの真の10秒シーンを可能にします。
ボーナスヒント:
「終了フレーム抽出器」の出力を次のシーンの「開始画像」入力に接続することで、複数のシーンを1つの連続した映画に連結できます。これにより、画像を手動で再読み込みすることなく、完全に滑らかなトランジションが実現できます。