Wan2.2 I2V long video with audio - FOR DUMMIES!

詳細

ファイルをダウンロード

モデル説明

私みたいなヌルヌルですか?


更新:2025年11月1日 PDT 14:44

v1.2をアップロードしました。すべてのコメント投稿者の提案を取り入れました——そして**ありがとう!それ以来、速度と品質が大幅に**向上しました!皆さん、最高です!


これらのワークフローはすべて、めちゃくちゃ複雑に見えますよね?どの設定をいじればいいの?なんで急に全部壊れてしまったの?

私はCoyotteのMoviemakerを数日間試しました——素晴らしいワークフローで、使うのが楽しい(もし私より頭がいいなら)——でも、自分用に、めちゃくちゃシンプルにしないとダメだと判断しました。あなたにも役立つかもしれません。

ワークフローの動作方法:
開始画像とプロンプトを入力するだけ。緑の箱を探してください。

いくつか調整可能な項目がありますが、紫(私にはピンクに見えるけど、いいや)の箱は、自分が何をしているか少しでも分かっている場合だけ触ってください。黒い箱はモデルの読み込み用です——これらは上級者に任せたほうがいいでしょう。赤い箱は絶対に触らないでください。全部壊れます。

このワークフローはJoyCaptionを使って画像を分析し、コンボプロンプトの最初の部分を生成し、LoraManagerを使ってLoRAのトリガー単語を引き出し、あなたのプロンプトと統合します。サンプラーで何かマジックをかけて(私は初心者、あなたも初心者、この仕組みがどう動いているか誰も知らないから、マジックと呼んでる)、それを「作業用」動画に落とし込みます。その動画をこまめにチェックしてください。気に入らなければ、GPUリソースを無駄にしてアップスケールや音声追加をしないでください。


LoraManagerの使い方:

まず、Comfy ManagerでLoraManagerをインストールしたことを確認してください。

次に、http://[あなたのIPアドレス]:8188/loras にアクセスします。

初めてLoraManagerを使う場合、すべてのLoRAをインデックスするのに数分かかるかもしれません。問題ありません。いずれ、自分で再整理したくなるでしょう。

ここで、LoRAを選択し、マウスを乗せると小さな「送信」矢印が現れます。

今行っている作業に最も適したLoRAローダーを選んでください。

その後、ComfyUIのタブに戻ってください。選択したLoRAとそのトリガー単語がリストに表示されます。

これらのトリガー単語は自動的にプロンプトに追加されます。スライダーでLoRAの強度を調整し、不要なトリガー単語をクリックして選択を解除してください。


これで完了です。動画が生成され、楽しく使えるようになります。

私の環境(5090、他では試していません)では、10秒の非ループ音声付き動画を作るのに30分かかります。これだけの処理をこなすには、悪くないと思います。

VRAMが少ないGPUを使う場合は、JoyCaptionの設定をめちゃくちゃ下げてください。「String Ops」セクション(右下)でピンを外して拡大し、VRAMが24GB未満なら、3~4秒までに抑えることをお勧めします。

インストール:

Comfy-UIを初めて使う場合、ComfyUI Managerをインストールしてください。どうやってやるかは教えません——Googleで調べてください。インストール後、このワークフローを開き、Comfy-UI Managerで「インストールされていないノードをインストール」を選択してください。これで必要なノードがインストールされ、ComfyUI Manager内からComfy-UIを再起動します。その後、ページを再読み込みし、Managerを再度開いて「Model Manager」に移動し、フィルターを「ワークフロー内」に変更して、すべてのモデルをインストールしてください。これはかなり時間がかかります。ファイルが巨大だからです。

この手順でMMAudioモデルがインストールされない場合があります。その場合は、以下からダウンロードしてください:https://huggingface.co/Kijai/MMAudio_safetensors/tree/main

ファイルを以下に配置してください:ComfyUI/models/mmaudio

KIJAIさんに感謝!

Nvidia bigvganv2は自動でダウンロードされるはずですが、されない場合は:https://huggingface.co/nvidia/bigvgan_v2_44khz_128band_512x

NvidiaのHugging Faceからすべてのファイルを以下に配置してください:ComfyUI/models/mmaudio/nvidia/bigvgan_v2_44khz_128band_512x

頑張って!楽しいムービーメイキングを!

私のワークフローがダメだと思ったら、傷つかせません。どう改善できるか教えてください。これは私の初ワークフローです。

気に入ってもらえたなら、それは最高です!

このモデルで生成された画像

画像が見つかりません。