Wilykit v3 - (Thundercats 2011)

詳細

ファイルをダウンロード

モデル説明

Wilykit v3 - Thundercats 2011

v3のプレビュー画像は、 adetailer拡張機能 を使用して、より高解像度で顔部分を生成・補間しています。

これは、Thundercats 2011のリブート版から着想を得た(予想がついた通り)WilykitのLoRAです。v3はトレーニングプロセスを完全に再構築したもので、より柔軟性が高まり、信頼性も向上し、キャラクターの再現精度も向上するはずです。

TL;DR

トリガー語として

Wilykit, tail

を使用してください。

基本的な服装(コンポジションに応じて必要に応じて削除)

wkoutift, crop top, single strap, armlet, midriff, single vambrace, utility belt, belt pouch, skirt, barefoot, detatched leggings

初期設定として1.5の重みをお勧めします(トレーニング方法の特性上、通常より高い重みが必要です)。より人間らしく見せる場合は0.8でも問題ありませんが、顔の模様や体の陰影が失われることになります。ただし、より柔軟性が得られます。2.5~2.8まではアーティファクトが現れない範囲でさらに重みを上げられます。重みが高いほど、模様がより明確になります。

このLoRAは、ほとんどのモデルやスタイルLoRAと互換性があるはずです。
現実的なモデルでも使えることが確認されています!

TL;DR終了。以下、より詳しい説明です!

v2からv3にかけて、プロセスにどのような変更が加えられたか

  • データセットを大幅に拡張し、完全に再トレーニング。v2は全部で約40枚のファンアートのみのデータセットでしたが、v3はファンアートと公式アートの合計170枚以上に拡大。頭部クロップ画像は含まずに計算した場合、総量は250枚以上になります。トレーニング方法は、私のMereoleona LoRAで使用したものと同じです(詳細はMereoleona LoRAの説明を参照、または以下の説明をご覧ください)。

  • すべての画像に対して手動によるタグ付けが行われました。前バージョンで使用していた自動生成タグとは異なります。

  • Wilykitの代表的な衣装を特別にトレーニングし、タグ付けしました。また、異なる衣装に着せることの柔軟性も確保し、基本衣装の色がプロンプトに応じた新しい衣装に「漏れ出る」ことを防ぐように工夫しました。

以前のバージョンで見られた特有の問題(プロンプトで衣装色を指定していない場合に基本色が漏れる、トレーニング画像のスタイルが影響する、尾が表示されない、顔・体の模様が表示されないなど)は、ほとんど目立たなくなりました。

唯一あるのが、時折尾が体から分離してしまう、尾の形が正確でない、または複数の尾が表示されるといった現象です。画像生成においては、この程度は普通のことで、LoRAを使わなくても尾は通常正しく生成されません。

基本衣装の色が他の衣装に漏れる問題は、大部分の範囲で改善されています。もちろん、色を明確に変更するプロンプトを出していない場合、一時的に色が残る状況は依然としてありますが、今回は色の変更が大幅にしやすくなったため、暗青色/紫以外の衣装をプロンプトする際、いつもより簡単に求められるはずです。

スタイルの「漏れ」も根本的に解消されました。観察によると、スタイルにほとんど偏りがなく、中立的になっています。一部のタグがわずかに影响を及ぼすことはありますが、以前のLoRAほど偏りが激しくありません。

前述したように、このトレーニング方法の特性上、キャラクターの細部(顔の模様、体の陰影:白いお腹、茶色い体、前腕および足首が白いなど)を引き出すためには、通常よりも高い重みが必要です。これらの要素があなたにとって重要でない場合は、通常の重みでも問題ありません。トレーニングの設計上、高重みでもスタイルに影響を与えることはありません。というのも、本トレーニング法の主な目的の一つが、色やスタイルがブレる問題(v2ではこの問題が生じていました)を最小限に抑えることだったためです。

このことにより、高重みを設定することで画像に良い影響を与えることが可能になります。高重みにすることで、体の模様がより強調され、対比も明確になります。一般的にはLoRAを使用するのに高い重みが必要ですが、私はこの特性を「利点」と捉えています。なぜなら、体の模様を切り替え可能なスイッチとして扱えるようになり、キャラクターの本質を根本的に変えずに済むからです。

トレーニング方法に興味がある方へ(何度も話題にしているので、ここでも説明)
これは、私のMereoleona LoRAで使用したものと同じです。近日中に詳しいガイド記事を公開予定ですが、ここでは簡潔に説明します。

  • 公式アートのみを使用してLoRAを作成する(fancaps.netが最高の味方です)。
  • 同様に、公式アートのみでLoRAを作成するが、今回は頭部のみをクロップした画像のみでトレーニングする。
  • 上記2つのLoRAを0.7:0.3の比率でマージ(ボディ:0.7、ヘッド:0.3)
  • 同様にファンアートのみでLoRAを作成する。
  • 最終的なファンアートLoRAと最終的な公式アートLoRAを、再び0.7:0.3の比率でマージ(ファンアート:0.7、公式アート:0.3)

最終的に得られるLoRAは、各構成要素の合計以上の品質を発揮し、柔軟なキャラクターモデルを提供するとともに、公式アートのみを含む「常にオン」の高品質な細部も維持します。

唯一のトレードオフは、4つのLoRAをマージしているため、全体の強度が減ってしまう点です。これを補うために、プロンプトの重みを高める必要があるため(これが2.0という数値を採用している理由です)。

より高めのエポック数で、やや「過学習」気味のLoRAを用いてマージの試みも行いましたが、その結果はまだほとんど差がなく、平均化しても効果はほとんど発揮されていません。

このモデルで生成された画像

画像が見つかりません。