Wan2.2 I2V GGUF Workflow (For-Loop w/ Individual Loras + Auto Caption + Predictive Flow + FLF + T2V -> I2V + Upscale/Interpolate)

詳細

モデル説明

バージョン3ノート

まず、これはイテレーション間の移行を滑らかにするために私が作成したカスタムノードを使用しています。ワークフローのダウンロードに含まれる全体のフォルダを、カスタムノードディレクトリに配置してください。

バージョン3は現在実験段階です。さらにテストや調整が必要ですが、いくつか魅力的な機能があるため、共有したいと思います。

  • 予測フロー — これはおそらく最もクールで、現在最も安定して動作しています。基本的にイテレーションの終わりに、次のイテレーションがどのように始まるべきかを予測します。この予測結果は潜在空間に変換され、次のイテレーションとブレンドされます。イテレーション間のジャitterを軽減します。

  • ノイズ適応 — イテレーションの品質が低下しノイズが増える場合、動的にステップ数を増やし、サンプラーのパラメータを調整します。

  • フェースID — 現在はWAN互換性の問題で動作していませんが、顔の歪みを防ぐことを目的としています。現在も対応中です。


バージョン2から、T2V機能を新たに追加しました。これにより、最初のイテレーションをI2VワークフローではなくT2Vプロンプト作成から開始できるようになります。その後のイテレーションはI2Vで継続され、希望する限りT2Vプロンプトを繰り返し使用できます。

T2VでのFLFは、まだアップロードした画像を参照していることに注意してください。将来的には、T2Vで生成された最初の画像を参照したいと考えていますが、現在は条件ロジックを設定していません。

クレジットに関する注記:

ベースは /model/1829052?modelVersionId=2070152 から取得しました。

Florence関連の大部分は /model/1687498/wan-2221-i2v-2-workflows-merge-fusionx-lora-2-sampler-florence-caption-last-frame-color-match?modelVersionId=2061133 から取得しました。

FLF周辺の機能は主に私が試行錯誤して追加したものであり、前述の2つのワークフローから好みに合わせていくつか調整を加えています。

これは何をしますか?

これは基本的には、gguf WAN2.2のループワークフローです。実行するイテレーション数を自由に設定できます。最後のイテレーションでは、連続性を高めるためにFLFワークフローに切り替えるオプションがあります。

機能:

  • ループベースのI2V ggufワークフロー

  • 最初のイテレーションをT2VからI2V ggufワークフローに移行

  • イテレーションごとの自動キャプション生成 + イテレーションごとにカスタマイズ可能な追加テキスト

  • 画像の自動リサイズ(マットエラーを回避)

  • 最後のループイテレーションはFLFに移行(オプション選択可能)

  • アップスケール + 補間

  • イテレーションごとに個別に高・低LoRAを設定(パワーLoRAで選択が容易)

  • ClownsharKSamplerを使用

今後追加予定(これらについてさらに学習した後):

  • VACE統合(Phantomも検討中)

  • スプライン統合

これまで、線形/Euler + beta57で良い結果を得ていますが、より良いオプションを探し続けています。

このモデルで生成された画像

画像が見つかりません。