Anime style lora M1 | Wan2.1 & 2.2 T2V 14B
詳細
ファイルをダウンロード
モデル説明
トリガー語: アニメスタイルの女の子
学習済み: musubi-tuner、20~30枚のAIイラスト
キャプション: Qwen2.5-VL-3B から調整されたキャプション(背景の記述を含む)
lr: (2e-4, flow_shift3.0)
epoch: 100
train_step: 3000
lora_strength: 0.8
サンプルプロンプト: 初音ミク、アニメスタイルの女の子。 (彼女はベッドルームでベースギターを演奏している:1.2)
アクションは強調プロンプトによって調整する必要があります。またはモーションLoRAを併用ください。
Action prompt should be adjusted depending on emphasis prompt. Or motion lora use together.
-----------------------------------------------
・kijaiのCausvid v2_loraを使い、step=20, cfg=6.0からstep=10, cfg=1.0とした場合
動画生成速度は4倍に向上したが、生成品質が悪く、プロンプトのモーションが反映されにくくなった。
プロンプトのモーションが反映されにくい問題は、プロンプト強調倍率を上げることで、プロンプトに従って動くようになった。
キャラクタLoRAでもプロンプトが反映されにくいことがあったため、同じ問題だろう。
一方で生成品質がそれほど良くないため、試しにスタイルLoRAを作成することにした。
一応、cfg>1を設定すると品質は向上するが、生成時間が2倍に延びる。cfg=1.0のまま品質を上げたい。
画像生成AIで作成された画像を集め、それを3つに分類し、3つのLoRAを学習させた。
M1はアニメ風、M2はシンプルな可愛いイラスト、M3は複雑で美しいイラスト。
基本的にCausvid LoRAとの併用を推奨します。
また、複数LoRAを使用するためか、LoRAの読み込みで一時的にバグが発生した場合、ComfyUIの再起動が必要でした。




