バージョン3:大幅な変更。これはLoRAではなくLoConです(LoConの本当の力が何かは分かりませんが、今やより良い結果が出ているので、かなり助けになっていると思います)。またはLyCORIS(彼らはおそらくリコリスアニメの熱狂的なファンなのだろうな、ロールプレイが楽しそう)を、次のような設定でトレーニングしました:dim 32、alpha 16、解像度768。もちろん、Adafactorの助けを借り、また不要な画像(低品質または頭が大きく体が小さいもの)を削除してデータセットをさらに簡略化しました。たとえ私がマップルストーリーのデータセットに基づいてトレーニングしたとしても、スタイルはオリジナルより進化しており、色合いがより良く、表現力が高まっています。ただし、このモデルは過剰適合しやすいので、hires fixを必ず使う必要があります。つまり、今回のLoConは色がより鮮やかになり、よりキレがあり、目の質感も大幅に向上しています。
データセットがマップルストーリーのイラストに集中しているため、バージョン1や2よりもマップルストーリーのキャラクター風に描けるようになりました。好みが分かれるかもしれませんが、バージョン1や2も引き続き利用可能です。これらはそれなりにオリジナルな色合いを持っています。
バージョン1や2の問題点が分かりました。プロンプトが短いほど、LoRAがスタイルを正確に再現できるということです。たとえば、「chibi 1girl」だけをプロンプトに入れた場合、完璧なスタイルが出ますが、長めのプロンプトをコピーするとスタイルがすぐに歪んでしまいます。一方、バージョン3は改善されています。
例:8k, 4k, 1girl, chibi, solo, city, full body を使えば、以下のような結果になります。
ただし、キャラクターに特に拘りすぎると、以下のような結果になります(体がとても大きい)。
ネガティブプロンプトや(highres:1.1)、best quality、(masterpiece:1.3)(私の古いプロンプト)は、スタイルに大きな影響を与えます。どれが最適かは人それぞれだと思いますが、現在私は4k、8k、easynegative埋め込みを使用しており、これが最も良い結果を出します。
モデルによって出力は異なります。
手の部分は未だにうまくいっていません。四本指のことは本当に申し訳ない。
「頭大きく体小さい」をより強調したい場合は、(chibi:1.x)を使うことがコツです。
おそらくこれが最後のLoConになるでしょう。LyCORISのLoHaがスタイル品質にさらに大きな影響を与えるなら、話は別ですが。
私がこのLoRA/LoConを作ったのは、ただ自分のキャラクターを描きたかっただけですが、うまくいかなかったようです。もしかしたら他の人が私よりもより良い使い方をできるかもしれません。
バージョン2
同じ古いデータセットを使い、新しい学習率、テキスト学習率をAdafactorの助けを借りて再トレーニング。結果は驚き。大きな変化があります:
- より色鮮やか
- 物体の認識がより正確
- 線が細くなった気がする
- 同一キャラクターに複数のバリエーション(ガチャの時期到来)
個人的に、このバージョンの方が質の高い結果が出ると感じます。
ただし、時折、バージョン1のスタイルの方がゲーム内キャラに近いかもしれない。
実際に試した際、(chibi:2)を使うと、結果は意外と良いです。ある種、イラストの中で一般的なキャラクター風に近づいている感じがします。笑。
バージョン1
数百枚のマップルストーリーのイラスト、NPCアート、ファンアート、一部、より良いNSFW画像を可能にするための追加ファンアートをデータセットとして使用し、LoRAをトレーニング。
おすすめオプション:
- スタイルを確実に確保するため、プロンプトに「chibi」を含める
- 他のLoRA(たとえば2 VTuberの絵など)と組み合わせる際は、0.7~0.8程度の割合が効果的
- 主にDPM++ 2M KARRASで画像生成を行っています
NSFWっぽい要素をプロンプトに入れない限り、SFU画像を期待してはいけません。私もNSFWでも良いように調整したいからです。
時にスタイルが大きく逸脱しているように見える場合がありますが、「Generate」ボタンをもう一度クリックしてみてください。以上です。それでは、275まで駆け上がります。ちなみに私のメインキャラは「シェイド」ですが、誰にも気づかれなくても大丈夫です。