hoshino ruby dance - CogVideoX1.5-5B-I2V img2vid

詳細

ファイルをダウンロード

モデル説明

CogVideoX1.5-5B-I2V向けのLoRaによる最初の実験

LoRaの品質は以下の要因によって低下する可能性があります:

  1. 解像度720x480で、13フレームからなる45本の動画で学習した

  2. 学習中に1語のプロンプトのみを使用した

  3. アニメーションの特性上、非常に不自然な動きが得られる

Framerや他の優れた2D動画補間手法が登場した際、LoRaの再学習を試みます。

動画の再生速度を調整して実験してみてください。

以下は例で使用したパラメータです:

プロンプト:スローモーション、スムーズなゆっくりしたダンス、Live2Dアニメーション

LoRaの強度:0.8

フレーム数:13(半分が静止しているため、53を使用した方が良い)

ステップ数:25

このモデルで生成された画像

画像が見つかりません。