24s WAN-Video in 10 Minutes
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
私は、たった10分で24秒の動画を作成できるワークフローを開発しました。その核心は、Diffusion Force システムに基づき、Kijai の WanVideoWrapper ノードとSkyreel V2 DF モデルを組み合わせて実現しています。プロセスは、Illustrious/SDXL を使用して高品質な画像を生成することから始まります(より現実的な仕上がりを実現するため—Skyreel の TXT2VID 出力よりもはるかに優れた外観です)。この画像が、生成パイプラインに投入される初期フレームとして使用されます。
約24秒の連続的なシーンは、7つのサブプロンプトを使用して生成され、各サブプロンプトは97フレームを生成します。これらのサブプロンプトは手動で作成することも、LLMによって生成することも可能です。私は現在Ollamaを使用していますが、この部分は簡単にカスタマイズできます。
高速化は、CausVid LoRA V2を高強度で使用し、CFG ステップスイッチャーを組み合わせることで実現しています:最初の3ステップはCFG 4で、その後7ステップはCFG 1で実行します。これにより、レンダリングは高速なまま、滑らかで自然な動きを維持できます。ただし、このシステムは急激な動きの遷移には対応していません。たとえば、走り始めた直後に急停止するようなシーンは動作せず、キャラクターはそのまま走り続けてしまいます。
最終的に、7つのセグメントを統合して完全な動画を作成し、重複フレームを除去して連続性を確保します。
これは複雑ですが整理されたワークフローで、Anything Everywhere ノードと隠された接続によって管理可能になっています。ご質問があれば、遠慮なくお尋ねください。
一つのヒント:LLMはプロンプト作成に完璧ではありません。私はこれを広範囲にテストし、数日間の実験を経て、結局自分でプロンプトを書くことに戻りました。手動で作成した場合、品質は明らかに優れています。
