Nana - Nana to Kaoru

詳細

ファイルをダウンロード

モデル説明

こんにちは、また私のニッチなLoRAをご紹介します。これは、『ななとカオル』シリーズのナナを生成するために作られました。

このLoRAは、CivitAIのトレーナーを使って1つのキャラクターと複数のスタイルを同時に学習する可能性をテストするために作成されました。その結果は、予想をはるかに上回るものでした。

注意:このLoRAはNSFW画像の生成を目的としていませんが、そういった画像の生成に使用される可能性があるため、ご注意ください :)

ベース版

このバージョンには以下のキーワードがあります:

n4n4            <-- キャラクターを生成するためのキーワード
bow             <-- (オプション)LoRAの強度を低くした場合に有効

----------------------------------------------------------------------------

from_anime      <-- このタグは成功裏に学習されましたが、学習に使われた画像の品質が低かったため、現在は否定タグとして機能します(詳細セクションをご覧ください)

----------------------------------------------------------------------------

from_manga      <-- マンガのスタイルでナナを描きたい場合に使用してください。モノクロ画像にも通常のカラー画像にも対応します(モノクロ画像を生成したい場合は、「monochrome」と「greyscale」タグと併用してください)

----------------------------------------------------------------------------

from_illustration <-- 画像のスタイルをシリーズのイラストに近づけます。背景にややソフトなバイアス(特にグラデーション背景)がかかっているため、特定の背景を希望する場合はプロンプトで明確に記述し、「シンプルな背景」などの一般的な表現だけに頼らないでください

LoRAの強度は、目的の結果に応じて0.5~1の間で設定してください(詳細は「詳細」セクションを参照)。私は0.7~0.8程度を推奨します。

個人的には、Eulerサンプラーを主に使用してテストしましたが、他のサンプラーを使っても大きな問題は起きないはずです(使用しているモデルで問題なく動作するものであれば)。

モデルに関しては、ほとんどのモデルで良好に動作しますが、モデルによってLoRAの強度を調整する必要があります(例:hassakuを使用する場合は、LoRAの強度を下げないと画像が過飽和になります)。

詳細:

このバージョンは、33枚の画像(各ソース:マンガ・アニメ・イラストから約10枚ずつ)を使用して学習されました。これにより、キャラクターの特徴をしっかり学習し、スタイルの概要も捉えることができました。

モデルは、バイアスの有無を確認するために何度もテストされました。

(このセクションのテストは、anyLoRA ckpt prunedを使い、512×768解像度、40ステップ、インペイント、highres.fix、adetailerを使用せずに実施しました)

テスト1


最初のテストは、LoRAが「n4n4」の概念を習得しているかを確認することでした。ご覧の通り、LoRAの強度0.5から生成への影響が明確に現れ、意図通りに機能しています(PS:キャラクターの衣装は明確な意図がなかったため、「school_uniform」や「white_shirt」などの指定が必要な場合があります)。

テスト3~5はすべて同じLoRA強度で、同じ順序(上部はポジティブプロンプト、下部はネガティブプロンプト)で実施しました

テスト2


2番目のテストは、LoRAにカメラアングルのバイアスがあるかを確認するため、LoRA強度1で複数のアングルをテストしました。カメラアングルを明示した場合は問題なく動作し、アングルを指定しない場合は「上半身」画像が生成されやすく、「カウボーイショット」+「ポートレート」のカメラアングルに近い結果になります。

テスト3


3番目のテストは、「from_anime」タグをポジティブプロンプト(上)とネガティブプロンプト(下)で使用した場合の結果を確認することでした。

LoRA強度0.5~0.7の範囲で、タグがスタイルに強い影響を与えることがわかりました。ポジティブプロンプトでは低品質な画像が生成されますが、ネガティブプロンプトでは生成の安定性が向上します。

テスト4


4番目のテストは、「from_manga」、「greyscale」、「monochrome」タグをポジティブプロンプト(上)とネガティブプロンプト(下)で使用した場合の結果を確認することでした。

ポジティブプロンプトではマンガのスタイルと一致し、ネガティブプロンプトでは「イラスト」や「マンガ表紙」に近いスタイルへと誘導されます(この場合、イラストでよく見られるナナの厚い唇の問題が発生しません)。

テスト5


5番目のテストは、「from_illustration」タグをポジティブプロンプト(上)とネガティブプロンプト(下)で使用した場合の結果を確認しました。

どちらのケースも良好ですが、ネガティブプロンプトで使用するとNSFW寄りの画像が生成されることがあります。

注:ほとんどのテストで私はこのタグ(および「from_manga」タグ)を継続的に使用し、場合によっては両方を組み合わせて面白い結果を得ました。ただし、特定の結果を得るにはこのタグの強度を調整する必要があるかもしれません(例:ナナの口の生成が奇妙になったことがあり、それはアングルが狭すぎ、かつ「from_illustration」タグが厚い唇を強制的に生成しようとしていたためです。解決法はタグの強度を0.7~0.8程度に下げることでした)。

テスト6


このテストは、スタイルタグ(ポジティブプロンプトに「from_manga」と「from_illustration」、ネガティブプロンプトに「from_anime」)を組み合わせた場合の結果を理解するために行いました。

LoRAをフル強度でも結果は安定していますが、LoRA強度1でこの戦略を使う場合は、スタイルタグの強度を調整するとよいでしょう。目安として、2つのスタイルタグの強度の合計が1.5を超えないようにすると良いです。

結論

これは私の最高のLoRAではなく、多くの皆様にとって役立つとは限りませんが、いくつかの理由で共有したいと思います。

第一に、出力は十分に質が高く、このキャラクターの他のLoRAは見つかりませんでした。

第二に、良質なデータセットの重要性を示すためです。学習に使用したアニメ画像の品質が低すぎたため、それらを除外すればLoRAの性能はさらに向上した可能性があります。

第三に、LoRAをテストし、自分自身が費やした思考と努力を振り返ることは、学ぶべきことが増えると信じているからです。

いつもどおり、このモデルが気に入っていただけたら、ご自身の生成物を共有してくださり、応援のためにバズを寄付していただけると嬉しいです :)

このモデルで生成された画像

画像が見つかりません。