WAN2.1 | FusionX | LLM | SDXL or FLUX | Upscaling
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
WAN2.1 | FusionX | LLM | SDXL/FLUX/PONY | アップスケーリング
SDXL版(PONYファイルも問題なく動作します)は、初期画像生成と調整に任意のSDXL/PONYモデルを使用します。
FLUX版は、WAN部分に渡す前に、調整のために別途SDXLモデルを使用します。
(ほとんどの)WAN T2Vワークフローにはまだ不満があり、テキストからWAN動画を作るより楽しい方法をさまざまな方法で試しています。
このワークフローでは、比較的シンプルで短い基本プロンプトをLLMに渡して、拡張・強化されたプロンプトを生成し、複数の画像を作成してその中で最も良いものを選択します。
選ばれた画像はアップスケール・調整され、LTXV画像キャプション生成器に渡されて拡張された画像プロンプトが生成されます(このプロンプトを上書きして手動で入力することも可能です)。

個人的には、LLMプロンプト強化機能を固定シードで使用することを好みます。使用するLLMモデルによっては、SDXLが処理するには「あまりに詳細すぎる」プロンプトが生成されることがあります。その場合は、手動でシードを変更してください。
ほとんどのSDXLモデルは、強化されたプロンプトを非常に良く従います(SFWとNSFWの両方)。

選ばれた画像はアップスケール・調整され、LTXV画像キャプション生成器に渡されて拡張された画像プロンプトが生成されます(このプロンプトを上書きして手動で入力することも可能です)。

デフォルトでは、3つのWAN LoRAが読み込まれます(その後にFusion X LoRAが続きます)。
クレジット:WAN生成は主に、/model/1309065/wan-21-image-to-video-with-caption-and-postprocessing?modelVersionId=1998473(ユーザー:tremolo28)から取得し、いくつかの修正を加えています。
テストおよび投稿動画の生成に使用したハードウェア:
RTX 4070 Ti Super 16GB VRAM / 80GB RAM