hoshino ruby dance - CogVideoX1.5-5B-I2V img2vid
詳細
ファイルをダウンロード
モデル説明
CogVideoX1.5-5B-I2V向けのLoRaによる最初の実験
LoRaの品質は以下の要因によって低下する可能性があります:
解像度720x480で、13フレームからなる45本の動画で学習した
学習中に1語のプロンプトのみを使用した
アニメーションの特性上、非常に不自然な動きが得られる
Framerや他の優れた2D動画補間手法が登場した際、LoRaの再学習を試みます。
動画の再生速度を調整して実験してみてください。
以下は例で使用したパラメータです:
プロンプト:スローモーション、スムーズなゆっくりしたダンス、Live2Dアニメーション
LoRaの強度:0.8
フレーム数:13(半分が静止しているため、53を使用した方が良い)
ステップ数:25
