Wan 2.2 GGUF Workflow I2V with Upscale
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
このワークフローは、比較的「小さい」グラフィックスカード(特に12GB)で動作するI2Vモデルを構築・整理するための私のアプローチです。私はQ5 GGUFモデルを使用していますが、より小さいQ4やQ3モデルでもテストしました。これらはプロンプトの忠実度と品質にやや低下をもたらしますが、依然として使用可能です。ここにはLightspeed LoRAの使用方法や、すべてのモデル/LoRAをダウンロードできる場所のメモが含まれています。
RAMまたはVRAMが制限されている場合は、ComfyUIを--cache-noneパラメーター付きで実行することをお勧めします。
これにより、同じ動画に対して複数のバッチを処理する速度は遅くなりますが、動画の全体的な生成速度がはるかに安定します(中程度の家庭用PC構成では5〜6秒の動画を3〜4分で生成可能)。
また、画像検出と自動プロンプト補助のためにFlorence2(LLM)も使用しています。必要に応じて、手動プロンプトにアクションを追加するだけです。
さまざまなワークフローで見かける多くのノードがありますが、少なくともWan 2.2 I2Vでは、それらはほとんど効果がなく、オーバーヘッドを増やすだけです。
私は通常、480p(480 x 832)で動画を実行し、このワークフローでは2倍にアップスケールして960 x 1664にします。
使用したカスタムノード:
ComfyUI-GGUF (https://github.com/city96/ComfyUI-GGUF)
rgthree-comfy (https://github.com/rgthree/rgthree-comfy)
ComfyUI-KJNodes (https://github.com/kijai/ComfyUI-KJNodes)
ComfyUI-Florence2 (https://github.com/kijai/ComfyUI-Florence2)
ComfyUI-VideoHelperSuite (https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite)
WAS Node Suite (https://github.com/WASasquatch/was-node-suite-comfyui)

