Wan-LoRA-Arcane-Jinx-v1 [Wan 1.3B]
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
V2が登場!
主な違い:
やや性能が弱い
プロンプトによりよく従う
他のキャラクターへの色のにじみが減少
推論について
このモデルは長い説明的なプロンプトを好むようです。プロンプトの例については添付動画をご覧ください。私のテスト結果によると、短いプロンプトを使用するとLoRAの効果が弱くなります。
推論には以下を推奨します:
トリガー語: csetiarcane, Nfj1nx, blue hair
(スタイルやキャラクターが十分に反映されない場合は、プロンプトに「animation style」を追加することを推奨します。これによりスタイルが強化される場合がありますが、場合によってはあまりにアニメ調になりすぎる可能性があります)
強度: 0.9–1.0
学習詳細(v1):
私はまず画像のみでLoRAを学習し、一定ステップ後に動画のみで学習を継続する方法を試しました。
学習率(LR): 2e-5
最適化アルゴリズム: adamw_optimi
エポック数: 15(画像)+7(動画)
ステップ数: 2550(画像)+2520(動画)
データセット: 33枚の画像、35本の動画
リピート回数: 10
ランク: 128
バッチサイズ: 2
勾配累積ステップ: 1
学習にはDiffusion-Pipeリポジトリを使用しました。
謝辞
コミュニティのために惜しみない優れた貢献をしてくれたKijai、そしてそれらの機能を迅速かつ高品質でComfyUIにネイティブ実装してくれたComfyanonymous、さらにLoRA学習をコミュニティに迅速に提供してくれたTDRusselに深く感謝します。