Wan 2.2 I2V: HD/FHD resolution, but much faster

詳細

ファイルをダウンロード

モデル説明

このワークフローは「速度 vs 品質」のジレンマを大幅に緩和し、低スペックのハードウェアを持つユーザーでもHD解像度で動画をほぼ2倍の速さで生成可能にします!

動作原理

原理は非常に単純です:高ノイズモデルを非常に低解像度で実行し、その後、潜在変数をアップスケールして低ノイズサンプラーに投入します。

元の画像も再投入されるため、低ノイズサンプリング段階で新しいWanラッパーノードを使用することで、視覚的詳細が保持されます。

制限事項

  • 動きの繊細さは若干失われますが、ほとんどのケースで速度の向上が十分に価値があります。

  • T2Vではテストされておらず、おそらく動作しません。

はじめ方

  1. モデルをご自身のものに置き換えるか、下記リンクからダウンロードしてください。

  2. インストールに不足している場合は、以下に示す必要カスタムノードをインストールしてください。

  3. 画像を読み込み、プロンプトを入力してください。

  4. 実行をクリックしてください。

カスタムノード

必須

オプション

·         ComfyUI-GIMM-VFI(補間用)

使用モデル

Wan 2.2 14B I2V、量子化済み:

Lightx2v LoRas:

Fun LoRa:

速度ベンチマーク

  • 設定:65フレーム、Q5_K_M I2Vモデル使用、高ノイズ段階で4ステップ(lightx2v 1030)、低ノイズ段階で4ステップ(lightx2v 1022 および Fun HPS2.1 LoRas)、両方のサンプラーでeuler/betaサンプラー/スケジューラを使用。

  • ハードウェア:VRAM 12GB、RAM 32GBのRTX 3060。

768×1152px(2:3)

  • 768×1152、アップスケールなし:20′46″

  • 256×384 → x2 → x1.5:11′16″(-46%)

  • 256×384 → x1.5 → x2:10′48″(-48%)

720×1280px(9:16)

  • 720×1280、アップスケールなし:23′19″

  • 288×512 → x2.5:15′57″(-32%)

  • 288×512 → x2 → x1.25:11′57″(-49%)<- これが紹介動画です

ターゲット解像度とハードウェア要件

  • HD:VRAM 12GB以上

  • FHD:VRAM 16GB以上?(未検証、フィードバック歓迎)

ワークフローには、初期サンプリング解像度とステップ設定の推奨値が含まれています。

編集:最後のサンプラーのスケジューラはデフォルトでlinear_quadraticに設定されていますが、betaに設定する必要があります。

このモデルで生成された画像

画像が見つかりません。