WAN 2.2 – フレーム開始から終了までのシネマティックワークフロー（ラジアル/スパースセージアテンションパッチ付き）

バックループなしの超安定10秒動画

完全なWindowsガイド（Triton • SpargeAttn • RadialAttn）

実行環境要件：

Windows • Python 3.10–3.11 • RTX 4060 Ti 8GB 以上

ComfyUI バージョン： 0.3.6+
WAN バージョン： WAN 2.2 GGUF (VAC + CLIP) / ご希望のモデルに切り替えることができます

⭐ このワークフローの機能

このプロジェクトは、以下の特徴を持つ完全に安定した10秒動画を生成します：

ピンポン効果なし
フレーム崩壊なし
モーフィングアーチファクトなし
完全な開始→終了補間
フルワールドスペースモーション（ピクセルモーフィングではない）
高い時間的安定性
シネマティックなカメラ移動
オプション：フィルムVFIスローモーション
オプション：x4アップスケール＋シャープネス

デフォルトのWANや標準的なサンプラーとは異なり、このバージョンは：

SparseSageAttn + RadialAttn
を使用して、WANのアテンションウィンドウを約80フレームから161フレーム以上に拡張します。

これにより、WANは完全な10秒間を一貫したシーンとしてレンダリング可能になります。

⭐ 機能

真の開始フレームから終了フレームまでのワールド構築
SD3「Shift」パラメータ（推奨：10秒クリップには50）
開始フレーム＋終了フレームのサポート（24の完全制御シーン）
画像から動画、テキストから動画の両方に対応
スムーズなシネマティックな動き
フィルムグレイン、モヤ、モノクロ安定性
オプション：ClearReality x4 アップスケール
オプション：シャープネス処理
8GB GPUと互換性あり

🔧 インストール（Windows）

ステップ1 — Windows用 Triton のインストール

WAN 2.2 + RadialAttn には Triton が必要です。
正しいWindows用wheelをこちらからダウンロードしてください：
https://github.com/woct0rdho/triton-windows/releases

あなたのvenv内にインストールしてください。

ステップ2 — SparseSageAttn のインストール

Windows用wheelをこちらからダウンロードしてください：
https://github.com/woct0rdho/SpargeAttn/releases

あなたのvenv内にインストールしてください。

ステップ3 — RadialAttn ノードのインストール

こちらからダウンロードしてください：
https://github.com/woct0rdho/ComfyUI-RadialAttn

ComfyUIのcustom_nodesフォルダに配置してください。

ステップ4 — ComfyUI を再起動

Sparse / Radial Attn が正しく読み込まれると、起動ログに次のように表示されます：
“Using sparse_sage_attn as block_sparse_sage2_attn_cuda”

これでパッチが有効になります。

📸 ワークフローの動作原理

1. Shiftノード（SD3スタイルの条件付け）

SHIFTを増やすと、WANに次のように指示されます：
「時間経過とともにシーンを物理的に一貫性を持って維持してください。」

1秒あたりの推奨値：
SHIFT = 秒数 × 5
→ 10秒の場合：SHIFT = 50

これにより、全体のワールドモーションが安定します。

2. 開始フレームから終了フレームまでのサンプラー

以下のものを取り込みます：

開始フレーム（画像A）
終了フレーム（画像B）

そして、161フレームにわたる滑らかなワールドスペース補間を生成します。

アテンションパッチにより、WANの時間的メモリが拡張され、ピンポン効果が発生しなくなります。

3. FILM VFI（オプション）

有効にすると、FPSを滑らかに2倍または4倍に増加させます。
ベースラインレンダリング後に使用してください。

4. アップスケール（オプション）

アップスケールモデル = ClearReality x4

⭐ 重要なヒント

8GB GPU向け：

VFIの後にアップスケールを実行
VRAMの過負荷を避けるため
テスト中はアップスケールを無効にしてください（アップスケール＋シャープネスをグループトグルで隠してください）

🎥 ワークフローの使い方

1. 開始画像と終了画像を読み込む

各シーンに1組（A → B）を使用してください。

2. シネマティックなプロンプトを入力

プロンプトの例：

「動画は霧のかかったドイツの森から始まる。カメラは泥だらけの小道に沿ってゆっくりと前進する。モーフィングは一切ない。これは連続した世界である。動画の最後には、カメラは放棄された村に到達し、同じシネマティックなモノクロスタイルを維持する。」

3. SHIFT = 50 を設定

（10秒用）

4. 開始→終了フレームをレンダリング

WANは161フレームの完全なモーションを直接生成します。

5. オプション：FILM VFIを有効にする

スローモーション／より滑らかな動きのために。例：WAN 2.2は16fpsでトレーニングされているため、VFI x2を設定して出力を32fpsに、VFI x4を設定して出力を64fpsにします。

6. オプション：アップスケール＆シャープネスを有効にする

最大の明瞭さを得るために。

⭐ 設定に困ったら

この説明文全体をコピーしてChatGPTに貼り付け、次のように聞いてください：

「上記で説明されているWAN 2.2 開始フレームから終了フレームまでのワークフローを、Triton、SparseSageAttn、RadialAttn、SD3 SHIFT=50、デュアルKSampler、およびオプションのアップスケール／シャープネスのセクションを含めて、完全に再現したいです。
ComfyUIでこのワークフローをステップバイステップで再構築する手助けをしてください。」

すると、ChatGPTが手順をガイドしてくれます。

🏁 最終的な注意点

このワークフローは以下の用途に最適です：

シネマティックな移動撮影
ワールドビルディング
安定した長時間シーケンス
シーン間の物語展開
アーチファクトを最小限に抑え、一貫した動きを実現

SHIFT、開始→終了フレーム、アテンションパッチの組み合わせが、ループなしの真の10秒シーンを可能にします。

ボーナスヒント：
「終了フレーム抽出器」の出力を次のシーンの「開始画像」入力に接続することで、複数のシーンを1つの連続した映画に連結できます。これにより、画像を手動で再読み込みすることなく、完全に滑らかなトランジションが実現できます。

モデルタイプ	ワークフロー
ベースモデル	Wan Video 2.2 I2V-A14B
公開日	11/23/2025

WAN 2.2 GGUF/start end frame/t2v/i2v 8gb/10 seconds to 4 minutes workflow

詳細

ファイルをダウンロード

モデル説明