WAN 2.2 GGUF/start end frame/t2v/i2v 8gb/10 seconds to 4 minutes workflow

詳細

ファイルをダウンロード

モデル説明

WAN 2.2 – フレーム開始から終了までのシネマティックワークフロー(ラジアル/スパースセージアテンションパッチ付き)

バックループなしの超安定10秒動画

完全なWindowsガイド(Triton • SpargeAttn • RadialAttn)

実行環境要件:

Windows • Python 3.10–3.11 • RTX 4060 Ti 8GB 以上

ComfyUI バージョン: 0.3.6+
WAN バージョン: WAN 2.2 GGUF (VAC + CLIP) / ご希望のモデルに切り替えることができます


このワークフローの機能

このプロジェクトは、以下の特徴を持つ完全に安定した10秒動画を生成します:

  • ピンポン効果なし

  • フレーム崩壊なし

  • モーフィングアーチファクトなし

  • 完全な開始→終了補間

  • フルワールドスペースモーション(ピクセルモーフィングではない)

  • 高い時間的安定性

  • シネマティックなカメラ移動

  • オプション:フィルムVFIスローモーション

  • オプション:x4アップスケール+シャープネス

デフォルトのWANや標準的なサンプラーとは異なり、このバージョンは:

SparseSageAttn + RadialAttn
を使用して、WANのアテンションウィンドウを約80フレームから161フレーム以上に拡張します。

これにより、WANは完全な10秒間を一貫したシーンとしてレンダリング可能になります。


機能

  • 真の開始フレームから終了フレームまでのワールド構築

  • SD3「Shift」パラメータ(推奨:10秒クリップには50)

  • 開始フレーム+終了フレームのサポート(24の完全制御シーン)

  • 画像から動画、テキストから動画の両方に対応

  • スムーズなシネマティックな動き

  • フィルムグレイン、モヤ、モノクロ安定性

  • オプション:ClearReality x4 アップスケール

  • オプション:シャープネス処理

  • 8GB GPUと互換性あり


🔧 インストール(Windows)

ステップ1 — Windows用 Triton のインストール

WAN 2.2 + RadialAttn には Triton が必要です。
正しいWindows用wheelをこちらからダウンロードしてください:
https://github.com/woct0rdho/triton-windows/releases

あなたのvenv内にインストールしてください。

ステップ2 — SparseSageAttn のインストール

Windows用wheelをこちらからダウンロードしてください:
https://github.com/woct0rdho/SpargeAttn/releases

あなたのvenv内にインストールしてください。

ステップ3 — RadialAttn ノードのインストール

こちらからダウンロードしてください:
https://github.com/woct0rdho/ComfyUI-RadialAttn

ComfyUIのcustom_nodesフォルダに配置してください。

ステップ4 — ComfyUI を再起動

Sparse / Radial Attn が正しく読み込まれると、起動ログに次のように表示されます:
“Using sparse_sage_attn as block_sparse_sage2_attn_cuda”

これでパッチが有効になります。


📸 ワークフローの動作原理

1. Shiftノード(SD3スタイルの条件付け)

SHIFTを増やすと、WANに次のように指示されます:
「時間経過とともにシーンを物理的に一貫性を持って維持してください。」

1秒あたりの推奨値:
SHIFT = 秒数 × 5
→ 10秒の場合:SHIFT = 50

これにより、全体のワールドモーションが安定します。


2. 開始フレームから終了フレームまでのサンプラー

以下のものを取り込みます:

  • 開始フレーム(画像A)

  • 終了フレーム(画像B)

そして、161フレームにわたる滑らかなワールドスペース補間を生成します。

アテンションパッチにより、WANの時間的メモリが拡張され、ピンポン効果が発生しなくなります。


3. FILM VFI(オプション)

有効にすると、FPSを滑らかに2倍または4倍に増加させます。
ベースラインレンダリング後に使用してください。


4. アップスケール(オプション)

  • アップスケールモデル = ClearReality x4

重要なヒント

8GB GPU向け:

  • VFIの後にアップスケールを実行
    VRAMの過負荷を避けるため

  • テスト中はアップスケールを無効にしてください(アップスケール+シャープネスをグループトグルで隠してください)


🎥 ワークフローの使い方

1. 開始画像と終了画像を読み込む

各シーンに1組(A → B)を使用してください。

2. シネマティックなプロンプトを入力

プロンプトの例:

「動画は霧のかかったドイツの森から始まる。カメラは泥だらけの小道に沿ってゆっくりと前進する。モーフィングは一切ない。これは連続した世界である。動画の最後には、カメラは放棄された村に到達し、同じシネマティックなモノクロスタイルを維持する。」

3. SHIFT = 50 を設定

(10秒用)

4. 開始→終了フレームをレンダリング

WANは161フレームの完全なモーションを直接生成します。

5. オプション:FILM VFIを有効にする

スローモーション/より滑らかな動きのために。例:WAN 2.2は16fpsでトレーニングされているため、VFI x2を設定して出力を32fpsに、VFI x4を設定して出力を64fpsにします。

6. オプション:アップスケール&シャープネスを有効にする

最大の明瞭さを得るために。


設定に困ったら

この説明文全体をコピーしてChatGPTに貼り付け、次のように聞いてください:

「上記で説明されているWAN 2.2 開始フレームから終了フレームまでのワークフローを、Triton、SparseSageAttn、RadialAttn、SD3 SHIFT=50、デュアルKSampler、およびオプションのアップスケール/シャープネスのセクションを含めて、完全に再現したいです。
ComfyUIでこのワークフローをステップバイステップで再構築する手助けをしてください。」

すると、ChatGPTが手順をガイドしてくれます。


🏁 最終的な注意点

このワークフローは以下の用途に最適です:

  • シネマティックな移動撮影

  • ワールドビルディング

  • 安定した長時間シーケンス

  • シーン間の物語展開

  • アーチファクトを最小限に抑え、一貫した動きを実現

SHIFT、開始→終了フレーム、アテンションパッチの組み合わせが、ループなしの真の10秒シーンを可能にします。


ボーナスヒント:
「終了フレーム抽出器」の出力を次のシーンの「開始画像」入力に接続することで、複数のシーンを1つの連続した映画に連結できます。これにより、画像を手動で再読み込みすることなく、完全に滑らかなトランジションが実現できます。

このモデルで生成された画像

画像が見つかりません。