Wan-LoRA-Arcane-Jinx-v1 [Wan 1.3B]

詳細

ファイルをダウンロード

モデル説明

V2が登場!

主な違い:

  • やや性能が弱い

  • プロンプトによりよく従う

  • 他のキャラクターへの色のにじみが減少

推論について

このモデルは長い説明的なプロンプトを好むようです。プロンプトの例については添付動画をご覧ください。私のテスト結果によると、短いプロンプトを使用するとLoRAの効果が弱くなります。

推論には以下を推奨します:

トリガー語: csetiarcane, Nfj1nx, blue hair

(スタイルやキャラクターが十分に反映されない場合は、プロンプトに「animation style」を追加することを推奨します。これによりスタイルが強化される場合がありますが、場合によってはあまりにアニメ調になりすぎる可能性があります)

強度: 0.9–1.0

学習詳細(v1):

私はまず画像のみでLoRAを学習し、一定ステップ後に動画のみで学習を継続する方法を試しました。

  • 学習率(LR): 2e-5

  • 最適化アルゴリズム: adamw_optimi

  • エポック数: 15(画像)+7(動画)

  • ステップ数: 2550(画像)+2520(動画)

  • データセット: 33枚の画像、35本の動画

  • リピート回数: 10

  • ランク: 128

  • バッチサイズ: 2

  • 勾配累積ステップ: 1

学習にはDiffusion-Pipeリポジトリを使用しました。

謝辞

コミュニティのために惜しみない優れた貢献をしてくれたKijai、そしてそれらの機能を迅速かつ高品質でComfyUIにネイティブ実装してくれたComfyanonymous、さらにLoRA学習をコミュニティに迅速に提供してくれたTDRusselに深く感謝します。

このモデルで生成された画像

画像が見つかりません。