Wan 2.2 GGUF Workflow FTL (first to last image) with Upscale

詳細

ファイルをダウンロード

モデル説明

これは、私の画像から動画への変換(I2V)ワークフローで多く使用しているノードと同じものを用いています。また、低VRAMのGPU用に設計されています(私は12GBのGPUを使用していますが、Wan 2.2のQ3 GGUFファイルを使用すれば8GBでも動作することがわかっています)。

一般的な性能は、480p(480 x 832)で5〜6秒の動画を作成するのに約4〜5分かかります。これは2倍(960 x 1664)にアップスケールする時間も含まれています。また、私は「生」の16フレーム/秒を、RIFE+32フレーム/秒の最終出力よりも頻繁に保存します。これは動画をマージするのが好みであり、補間されていない動画の方がフレーム管理が簡単だからです。その後で改めて補間を追加します。

一つ注意点として、おそらくクオンタイズが低いため、照明の説明を使用すると不安定になりやすいです。特に81フレーム(5秒)以上、または97フレーム(6秒)以上を処理する場合、照明の大幅な変動が発生することがあります。いずれは余裕ができてPCをアップグレードし、より大きな高速RAM(VRAMだけでなく)を搭載して、より大きな非クオンタイズモデルを使えるようになりたいです。夢は見ていてもいいですよね…

このモデルで生成された画像

画像が見つかりません。