🚨 Hunyuan - Triple LoRA - Fast Workflow - RAM offload (720p on 3090) BY BIZARRO🚨

詳細

ファイルをダウンロード

モデル説明

更新:ノートとユーザー体験を改善しました。ご意見をお聞かせください。

また、モデルをアップロードしてタグ付けされたすべての方にBuzzをチップとしてお贈りします!あなたの美しい作品を見せてください! :)

V1.5 720Pがリリースされました:以前のバージョンに関する情報はその下に記載しています。


ComfyUI-MultiGPU を追加しました。これは画期的な進歩です!この改良により、これまで不可能だった解像度でHunyuanを実行できるようになりました。私のワークフローのパフォーマンスはすでに安定していましたが、この追加とsage attentionを有効にすることで、以下の生成時間を得ることができました。

3090 24GB VRAM。97フレーム、24fps、2つのLoRAをロード。

720x480:217秒(3.6分)

960x544:362秒(6分)

1240x720:800秒(13分)

sageのインストール方法を教えてくれたfiremanbrakeneckに感謝します。必要なガイドはこちらですが、設定はめちゃくちゃ面倒です。

https://www.reddit.com/r/StableDiffusion/comments/1h7hunp/how_to_run_hunyuanvideo_on_a_single_24gb_vram_card/

このプラグインの考案者であるSilent-Adagio-444には真に感謝します。彼はこのプラグインの実装と私のワークフローへの最適化にも協力してくれました。

手順はできるだけシンプルかつ簡潔に記載します。システムに応じてノードの設定を調整する必要があります。

手順:

  1. Comfy ManagerまたはGitでComfyUI-MultiGPUをインストールしてください。

  2. ComfyUI-GGUF(必須!)をインストールしてください。

  3. こちらのリンクからLLMのGGUFバージョンをダウンロードし、Unetフォルダに配置してください。

  4. UnetLoaderGGUFDisTorchMultiGPUを設定してください。私は4.5に設定していますが、VRAMが少ないカードを使用している場合はこの数値を増やす必要があります。最適な値を試行錯誤して見つけてください。

ここでの設定は私のシステム:RTX 3090(24GB VRAM)、64GB RAM用に最適化されています。
ご使用のハードウェアに合わせて設定を調整する必要があります。

720pではFast Hunyuan GGUF Q4_K_Mを使用しています。

割り当てるVRAMが少なければ少ないほど、処理は遅くなります。無料のランチはありません!
ご自身の環境に最適なバランスを見つけてください。

ワークフローと以前のバージョンに関する一般的情報:

大家さん、Bizarroです。数多くの最適化の末、Hunyuanから最大限の品質とパフォーマンスを引き出すために私が使用しているワークフローを共有できることを嬉しく思います。

このワークフローは、このYouTuberのワークフローを基にしています。私は数週間かけて設定を調整し、可能な限り最高の品質を実現しました。

また、多くの人が抱えていた複数LoRAの問題をついに解決しました!🚀 質感を落とすことなく最大3つのLoRAを混ぜ合わせることができ、同じシーンに複数のキャラクターを配置することも可能になりました。2つが最も効果的ですが、例では3つ(Bizarro LoRA、ワンダーウーマン LoRA、タノス LoRA)を同時に使用しました。

補足: 例として出力した結果はラッキーな偶然でした。実際、LoRAを安定して扱うのは難しいと後で気づきました。ただし、このワークフローは非常に高速で、結果は非常に優れています。新たに作成した例は随時追加します。LoRAのスタイルとLoRAのキャラクターを組み合わせるのにも最適です。

プロンプトを適切に構成することが重要です。キャラクターの性別(例:「白人男性」)、服、体型、フレーム内での位置などを詳細に記述してください。

このワークフローは3090に最適化されており、960x544で97フレームを8分以内に生成できます。VRAMが少ないカードを使用している場合は、より小さなGGUFバージョンを使用したり、品質を480pに下げてみてください。

[より多くの実験をしたい方は Xでフォローしてください

私は一日中動画生成について語り、また ユーモア動画も制作しています。]

私が使用しているこのGGUFバージョンは、以下から取得できます:こちら

私は多数のLoRAノードを試しましたが、どれもとても不満足でした。最終的に決定的なブレークスルーをもたらしたのは、このノードでした:

「In Order」モードに設定してください。 使用したいLoRAを選択し、それぞれのキャラクターを適切なトリガー語を使って詳細に記述します。

複数のLoRAウェイト値は、デノイジングプロセスの異なるステップに対応し、各段階でLoRAがどれだけ影響を与えるかを制御します。 前半のステップで高いウェイトを設定すると全体構造を形成し、後半のウェイトは細部を refining します。これにより、LoRAの効果が均一ではなく、画像や動画生成の過程で動的に適応する、洗練されたブレンドが可能になります。

2つのキャラクターには非常にうまく機能しますが、忍耐強く設定すれば3つでも問題なく動作します。

これはキャラクターだけでなく、あらゆる種類のLoRAに適用できます。

あなたがどんな作品を生み出すか、ぜひ見せてください!

愛をこめて、


Mr. Bizarro

このモデルで生成された画像

画像が見つかりません。