Wan 2.2 GGUF Workflow I2V with Upscale

詳細

ファイルをダウンロード

モデル説明

このワークフローは、比較的「小さい」グラフィックスカード(特に12GB)で動作するI2Vモデルを構築・整理するための私のアプローチです。私はQ5 GGUFモデルを使用していますが、より小さいQ4やQ3モデルでもテストしました。これらはプロンプトの忠実度と品質にやや低下をもたらしますが、依然として使用可能です。ここにはLightspeed LoRAの使用方法や、すべてのモデル/LoRAをダウンロードできる場所のメモが含まれています。

RAMまたはVRAMが制限されている場合は、ComfyUIを--cache-noneパラメーター付きで実行することをお勧めします。

これにより、同じ動画に対して複数のバッチを処理する速度は遅くなりますが、動画の全体的な生成速度がはるかに安定します(中程度の家庭用PC構成では5〜6秒の動画を3〜4分で生成可能)。

また、画像検出と自動プロンプト補助のためにFlorence2(LLM)も使用しています。必要に応じて、手動プロンプトにアクションを追加するだけです。

さまざまなワークフローで見かける多くのノードがありますが、少なくともWan 2.2 I2Vでは、それらはほとんど効果がなく、オーバーヘッドを増やすだけです。

私は通常、480p(480 x 832)で動画を実行し、このワークフローでは2倍にアップスケールして960 x 1664にします。

使用したカスタムノード:

ComfyUI-GGUF (https://github.com/city96/ComfyUI-GGUF)

rgthree-comfy (https://github.com/rgthree/rgthree-comfy)

ComfyUI-KJNodes (https://github.com/kijai/ComfyUI-KJNodes)

ComfyUI-Florence2 (https://github.com/kijai/ComfyUI-Florence2)

ComfyUI-VideoHelperSuite (https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite)

WAS Node Suite (https://github.com/WASasquatch/was-node-suite-comfyui)

このモデルで生成された画像

画像が見つかりません。