WAN22 I2V Dipping / Foot Motion

詳細

ファイルをダウンロード

モデル説明

もともとこのモデルは、足を靴の中にスライドさせて入れたり出したりするためのものとして作成しましたが、Wan生成に一般的な足や趾の動きを追加するのにも非常にうまく機能します。

明らかに、靴を履いている状態で最も効果的です。サンダルでトレーニングしましたが、他の靴のスタイルにも対応します。

ベースはWan 2.2 A14B I2Vでトレーニングしましたが、すべてのプレビュービデオはtaek's Enhanced NSFWモデルを使用して作成されています。このLoRAは足の動きのみを担当していることに注意してください。ここで掲載されているすべてのNSFWプレビュービデオは、NSFWチェックポイントのおかげです!

高ノイズ強度:0.3〜1.0(初期値として0.5が推奨)

低ノイズ強度:1.0

高ノイズでの強度を上げると、Lightning LoRAによる全体的な動きが減速または抑制されます。

私が最もよく使用するフレーズ(他のフレーズも試して、創造的に使ってみてください):

d1pp1ng. she is wearing [shoes].
she slides her feet repeatedly back and forth within her shoes.
her toes flex and curl as they fill the sandal straps.

また、私は通常以下をプロンプトの最後に追加します:

her feet are moving continuously throughout the entire scene.

そうでないと、彼女の足の動きが途中で止まってしまうことがあります。

「物理」の再現性は一般に非常に良いですが、たまに足がストラップを透過してしまうことがあります。重みを上げると物理の再現性は向上しますが、動きの速度も遅くなります。そのため、重みの調整は実験的に行う必要があります。

テクニカルな詳細:

  • 単一の足のスライド動画(4クリップ)から開始し、その上でLoRAをトレーニング。その後、500クリップを生成し、そのうち約100クリップが十分な品質だった。
  • クリップの約90%は足のみ/膝下、約10%は全身だった。
  • クリップを複数コピーし、さまざまな速度に調整、トリミング、ミラーリングを行い、最終的にこのLoRAのトレーニング用に496クリップを用意した。
  • 同じセットに対して高ノイズと低ノイズの両方をトレーニング。解像度はすべて512x512(名目値)、高ノイズは1788ステップ、低ノイズは3576ステップまで。musubi-tuner(5090)を使用。

このモデルで生成された画像

画像が見つかりません。