Hunyuan Video Workflow for High VRAM Savings
詳細
ファイルをダウンロード
モデル説明
このワークフローはWSLでのみテストされています。必要に応じてTriton、Sage Attention、Bits and Bytesを使用できますが、メモリ使用量には影響しません。Bits and Bytesがインストールされていない場合は、TextEncoderの量子化を「無効」に設定してください。Sage Attentionを使用しない場合、メモリ使用量は増加します。
Enhance-a-Videoノードをfeta_argsに接続できますが、使用する重みによってはメモリ使用量にわずかな影響を与えます。Loraをモデルローダーに接続することもできます。
メモリ使用量に最も大きな影響を与えるのはblockswapノードです。この値を高くするほどメモリを節約でき、生成時間が長くなります。最初はダブルブロックから始めましょう。最大値は20です。さらにメモリを節約する必要がある場合は、シングルブロックを使用してください(最大値は40)。私は4080を使用していますが、720x480で約300フレームを25分ほどで処理できました。フレーム数を減らしながら解像度を上げることも可能です。24GB以上のVRAMを持つカードであれば、より多くの処理が可能です。
目標は、生成速度を維持しつつ、VRAMを最大限に活用するためにblockswapの値を可能な限り低く設定することです。例えば、2秒の動画に対して20/40に設定する必要はありません。より多くのフレームや解像度が必要で、すでにVRAMの限界に近づいている場合にのみ増やしてください。GPU-Zなどのメモリモニターを使用してください。VRAMの最大値に近くなりすぎると、OOMエラーは発生しないものの、本来の速度よりもはるかに遅く生成される可能性があります。私は16GB(16384MB)のVRAMを持っていますが、フルスピードで動作させるために16000MB以下に保つようにしています。少しでも超過すると、生成時間が2倍になる可能性があります。
ノートボックスは私のための参照用です。ご自身の参照用に変更してください。
