Anime style lora M1 | Wan2.1 & 2.2 T2V 14B

詳細

ファイルをダウンロード

モデル説明

トリガー語: アニメスタイルの女の子

学習済み: musubi-tuner、20~30枚のAIイラスト

キャプション: Qwen2.5-VL-3B から調整されたキャプション(背景の記述を含む)

lr: (2e-4, flow_shift3.0)

epoch: 100

train_step: 3000

lora_strength: 0.8

サンプルプロンプト: 初音ミク、アニメスタイルの女の子。 (彼女はベッドルームでベースギターを演奏している:1.2)

アクションは強調プロンプトによって調整する必要があります。またはモーションLoRAを併用ください。

Action prompt should be adjusted depending on emphasis prompt. Or motion lora use together.

-----------------------------------------------

・kijaiのCausvid v2_loraを使い、step=20, cfg=6.0からstep=10, cfg=1.0とした場合

動画生成速度は4倍に向上したが、生成品質が悪く、プロンプトのモーションが反映されにくくなった。

プロンプトのモーションが反映されにくい問題は、プロンプト強調倍率を上げることで、プロンプトに従って動くようになった。

キャラクタLoRAでもプロンプトが反映されにくいことがあったため、同じ問題だろう。

一方で生成品質がそれほど良くないため、試しにスタイルLoRAを作成することにした。

一応、cfg>1を設定すると品質は向上するが、生成時間が2倍に延びる。cfg=1.0のまま品質を上げたい。

画像生成AIで作成された画像を集め、それを3つに分類し、3つのLoRAを学習させた。

M1はアニメ風、M2はシンプルな可愛いイラスト、M3は複雑で美しいイラスト。

基本的にCausvid LoRAとの併用を推奨します。

また、複数LoRAを使用するためか、LoRAの読み込みで一時的にバグが発生した場合、ComfyUIの再起動が必要でした。

このモデルで生成された画像

画像が見つかりません。