Wan2.2 I2V GGUF Workflow (For-Loop w/ Individual Loras + Auto Caption + Predictive Flow + FLF + T2V -> I2V + Upscale/Interpolate)

これは実験版です。v3が完成し、さらにテストを終え次第、このバージョンを削除します。

このバージョンでは、私が作成したカスタムノードを使用しています。フォルダ全体を predictive_flow として custom_nodes に配置し、ComfyUIを再起動してください。

カスタムノード：Motion Prediction - イテレーション間の移行を滑らかにし、動きの不自然な揺れを軽減します
適応的ノイズステップ：開始からの追加ノイズ量を計算し、特定の閾値に達した場合、ステップ数を増やしてデノイジングを減らします
顔の劣化防止（現在機能していません） - 参照画像の顔を維持するようモデルを誘導しようとしています。現在は問題を引き起こすことはありませんが、効果はないと考えられます

バージョン3ノート

まず、これはイテレーション間の移行を滑らかにするために私が作成したカスタムノードを使用しています。ワークフローのダウンロードに含まれる全体のフォルダを、カスタムノードディレクトリに配置してください。

バージョン3は現在実験段階です。さらにテストや調整が必要ですが、いくつか魅力的な機能があるため、共有したいと思います。

予測フロー — これはおそらく最もクールで、現在最も安定して動作しています。基本的にイテレーションの終わりに、次のイテレーションがどのように始まるべきかを予測します。この予測結果は潜在空間に変換され、次のイテレーションとブレンドされます。イテレーション間のジャitterを軽減します。
ノイズ適応 — イテレーションの品質が低下しノイズが増える場合、動的にステップ数を増やし、サンプラーのパラメータを調整します。
フェースID — 現在はWAN互換性の問題で動作していませんが、顔の歪みを防ぐことを目的としています。現在も対応中です。

バージョン2から、T2V機能を新たに追加しました。これにより、最初のイテレーションをI2VワークフローではなくT2Vプロンプト作成から開始できるようになります。その後のイテレーションはI2Vで継続され、希望する限りT2Vプロンプトを繰り返し使用できます。

T2VでのFLFは、まだアップロードした画像を参照していることに注意してください。将来的には、T2Vで生成された最初の画像を参照したいと考えていますが、現在は条件ロジックを設定していません。

クレジットに関する注記：

ベースは /model/1829052?modelVersionId=2070152 から取得しました。

FLF周辺の機能は主に私が試行錯誤して追加したものであり、前述の2つのワークフローから好みに合わせていくつか調整を加えています。

これは基本的には、gguf WAN2.2のループワークフローです。実行するイテレーション数を自由に設定できます。最後のイテレーションでは、連続性を高めるためにFLFワークフローに切り替えるオプションがあります。

今後追加予定（これらについてさらに学習した後）：

これまで、線形/Euler + beta57で良い結果を得ていますが、より良いオプションを探し続けています。