Haigure I2V WAN2.2 5B
詳細
ファイルをダウンロード
モデル説明
このLoRaは、Haigureを用いて画像から動画を生成できます。
例ではFastWanが使用されました。
トレーニング中には、以下の構造のミニマルなヒントが使用されました:
haigure, [スクワットして腕を動かす/腕だけを動かす]
また、ヒントには以下のようなものもありましたが、正確にどのように機能したかは不明です:
[カメラの動き/静止カメラ]、女性が話す
データセット内の一部の動画では、カメラが動いており、女性が話していました。
データセットは、実際の女性が登場する40本の正方形動画(辺の長さは480/512/768、フレーム数は121)で構成されていますが、LoRaはアニメにもよく適用できます。
LoRaはostris/ai-toolkitを用いてトレーニングされました。
