WAN 2.2 4-Stage SVI Promptorama for Nice Long Videos

詳細

ファイルをダウンロード

モデル説明

バグ#1:私は潜在変数スイッチを壊してしまったことを知っていた…新規実行時には、最上部の「潜在ディレクトリ」ノードをバイパスしてください。これによりSVI埋め込みが壊れます。ごめんなさい、これを修正する必要があります。私はおそらくnullに関する問題でスイッチを削除してしまったと思います。バイパスを使います。SVI固有のプロンプト連結も、最初のステージの埋め込みスタックから切り離せます。おそらく両方を同時に実行できるでしょう。なぜ突然このように動作が不安定になったのか、よくわかりません…以前は問題なく動いていたのに。なんとも不思議です。


さて、やっとこれを共有できる形に整えられました。現在、SVIのワークフローはたくさん公開されています。それらのほとんどは、私のより優れていると思います。でも、私は本当にSVIが好きなので、増えてくれるに越したことはありません。ここでの主なアイデアは、プロンプトとLoRAの切り替えを自動化することです。これにより、プリセットのシナリオを選ぶだけで、あとは一気に生成できます。タイピングも、ドロップダウンからの選択も、ああ!全部逆になっちゃった!なんて状況も一切不要です。SVIを試す前に、ComfyUIとWANには十分な精通が必要です。初心者がいきなりこのワークフローに飛び込むのはやめてください。髪の毛が抜けますよ。まだかなりごちゃごちゃしていて、もちろんこの壮大なモンスターではありません。私の出発点はこれでした。これは素晴らしいもので、SVIを学ぶにははるかに簡単な入り口です。しかし、今やこれが私のメインワークフローになり、仕上がりにとても満足しています。4つのプロンプトと4つのLoRAを独立して切り替えるのは、本当に面倒です。

以下が主な機能です:

  • 各ステージには独自のプロンプトセットが割り当てられます。16種類のセットから選べます(現時点で7つしか完成していません。残りは空です)。これを実現するには、たった2つのスイッチで十分です。茶色、赤、黄色、シアンのいずれかの色を選んでください。これらはそれぞれ4つのセットを含む大きなブロックです。次に数字を選んでください。インデックスを気にする必要はありません。上右、上左、下右、下左とラベル付けしてあるので、色グループ内でどのセットを選ぶかは明確です。選択は2つのFast Group Muterノードで行います。このWFに今後アップデートを加えるなら、さらにスロットが埋まるでしょう。グループをすべて設定して固定するのは面倒ですが、一度設定すれば、それっきりです。

  • 画像品質やSVI固有のモーションプロンプトをセットに含める必要はありません。これらはすでにステージ内で処理されています。もし変更が必要なら、GETノードからT5エンコーダーに接続されている2つの連結ノードを確認してください。各ステージにあります。ここに、特定の遷移や画像品質の設定を追加できます。したがって、プロンプトは行動や説明に限定してください。

  • ここが素晴らしい点です。プロンプトを設定すると、同時にLoRAも設定されます。つまり、各セットを一度だけ設定すれば済みます。サブグラフ内に進んでこれらを構成してください。グループはプロンプトの構成とまったく同じように並べられています。したがって、適切なノードに構文をそのまま貼り付けるだけです。すべてのサブサブグラフは最初、Managerローダーでしたが、非常に大きな遅延を引き起こしたため、現在は文字列に変更しました。プレビューとオートコンプリートが必要な場合は、側面に配置したローダーを使ってください。その中で設定し、文字列をコピーしてセットに貼り付けてください。私はフィルタリング済みの2.2 LoRAのスクリーンショットを取得し、Load Imageノードに挿入しました。同じことをお勧めします。グループを設定する際に、自分が持っているLoRAのサムネイルがたくさんあれば、非常に役立ちます。もちろんLManagerを使わなくても構いません。データはステージに到達するまで文字列であり、その時点でローダーを変更できます。

  • INPUTラジオボタンで、画像または動画のフレームから開始できます。

  • 潜在ディレクトリに保存された最後の潜在変数から継続したい場合は、「USE LAST LATENT」ラジオボタンをクリックしてください。もちろん、最初に1つを保存しておく必要があります。デフォルトディレクトリは、Comfyの出力フォルダ内の「latents」です。このステージはまだ作業中で、バグがあるかもしれません。出力が最後のフレームではなく元のフレームから始まる場合は、必要なフレームを取得して、最初のSVIノードのアンカー位置に配置し、潜在変数が'prev_latent'入力に正しく届くようにしてください。この場所は初回実行時には通常空です。この問題が解決でき次第、私のSVI FLFワークフローのように、既にエンコードされた動画からフレームを埋め込むオプションを追加します。これにより、動画から直接継続(フレームを単に取得するのではなく、モーションデータを取得できる)が可能になります。

  • デフォルトモデルは/model/2053259?modelVersionId=2477539です。私はこのモデルが大好きで、カメラプロンプティングが非常に優れています。次にもちろんSVI PROがあります。ライトニングLoRAとフルモデルを組み合わせて使いたい場合は、それら用のローダーが用意されています。デフォルトでは無効です。ライトニングとSVIの強度は、左上にあるすべてのローダーで設定されます。忘れないでください。Wrapperと互換性のあるT5エンコーダーがあります。これはちょっと悪質なエンコーダーです。

  • 私自身の好みの解像度をスイッチとアスペクト比反転器でプリセットしました。気に入らなければ、すべて削除してください。リサイズ入力にはコントラスト適応シャープネスが適用されます。これは非常に重要です。ぜひ試してみてください。私が保証します。あなたの生成結果の半分は、劣化した入力が原因です。どうして私が知っているかって?それは私自身の経験からです。CASはゴミを直せませんが、リサイズ時に発生する奇妙なぼやけを修正してくれます。比較ノードを追加したので、スライダーを中央に動かして、片手で額を叩けるようにしました。

  • うーん、他に何があったっけ…あ、ファイル名ですね。文字列ノードと連結ノードを確認し、お好みのファイル名、プレフィックス、サフィックスなどを設定してください。動画に直接保存することもできますが、フレームを保存することをお勧めします。これはデフォルト設定です。ユニークなフォルダ(前のフォルダに保存しないよう、インクリメントされた整数サフィックスが付きます。数字には意味はありません)を作成します。動画は最後に保存されるよう設定されていますが、プレビューとしてタグ付けされ、高CRFで保存されます。

  • 残念ながら、この設定の要求により、アップスケールと補間ステージを除外せざるを得ませんでした。追加することは可能ですが、大量のオフロードとパージが必要になり、次の生成に支障をきたす可能性があります。私はそのステージを別のマシンにオフロードしています。Mac Studio(M2 Ultra)は驚くほどよく処理してくれました。4倍アップスケールモデルは大量バッチでパニックを起こすこともありますが、基本的には非常にうまく動作します。しかし、話がそれました。要点は、出力はRAWのWANであるということです。

  • ステージ1、2、3にはそれぞれ独自のプレビューがあり、最終プレビューは連結されます。1+2、1+2+3などのプレビューは存在しますが、ステージグループ内で非表示かつ最小化されています。プレビューが多すぎます。

  • すべてでしょうか?あ、はい、左下のプロンプトボックスの隣にLoRAローダーがあります(プレビューサムネイルが表示されます)。これにより、サブグラフに潜る必要なく、実験的な設定を試して、気に入ったものをコピーして空きスロットに貼り付けることができます。

  • もちろん、このワークフローはWRAPPERノードとLoRA Manager、合計13のカスタムノードパックを使用しています。それほど多くはありません。すべてを入手してください。私みたいなアホがノードを持っているのなら、あなたのような天才が持たない理由などまったくありません。時にはコアノードで代用できる場合もありますが、できない場合もあります。本当にわかっている人もいます。私はいつかそんな人になりたいと思っています。

WFには豊富な注釈が付いています。重要な点にはすべて注釈がついています。もし使ってみてバグに遭遇したら、ぜひ教えてください。私は恥をかくのが大好きです。すべての設定の組み合わせをすべてデバッグするのは難しいので、ここには間違いなく地雷が仕掛けられています。

あ、このワークフローがモンスターであることを言いましたか?これは309フレームを出力します。私はCray X-MPにニューラルネットプロセッサと学習コンピュータでComfyを動かしています。しかし、これを動かすとあまりに熱くなるので、座席に座ることさえできません。警告します:コンピュータの上に座ってはいけません。やけどしますよ。

128GBのRAMがあれば安全に処理できます。最後には数パーセントくらい余るかもしれませんが、まずできるだけ不要なものをアンロードしてください。私のWFを実行する際は、必ずWindows Defender、ファイアウォール、アンチウイルスを無効にしてください。これらはRAMを掃除機のように吸い取ります。

VRAMも試してみてください。必要ですが、RAMほどは必要ありません。あなたがGGUFのクソガキなら、私は助けてあげられません。さようなら。

このモデルで生成された画像

画像が見つかりません。