Pen-Gesture

詳細

ファイルをダウンロード

モデル説明

こんにちは、このモデルは「penetration_gesture」というタグをillustriousXLで適切に生成する際に役立つことを目的としています。

他のユーザーが同じ目的で最近アップロードしたLoRAがありましたが、個人的にはやや不安定だと感じたので、自分で学習し直しました。それがこちらです。

バージョンについて話す前に、LoRAのポイントを簡単にまとめます。

  • 効果がありますか?はい、あります。

  • 安定していますか?はい、良い結果を得るには最小限の調整で済みます。

  • 他のLoRAではなく、これを使うべき理由は?現在、illustriousXL用でこのジェスチャーを実現しようとしているLoRAはもう1つありますが、私の素朴な意見では、こちらのほうがより安定していて、より汎用的です。

  • プレビューおよびバージョンセクションで見られるような結果を得るにはどうすればよいですか?推奨されるプロンプトや設定に似たものを使用してください。

  • モデルが気に入りました。どうすれば協力できますか?私の作業(私が認める以上に多くの時間を費やしたものです)を気に入っていただけたら、レビューを残して、ご自身の作品をアップロードし、友人と共有してください。

主な使用方法のヒントはバージョンセクションに記載されていますが、さらに多くのテクニック、ヒント、情報が知りたい場合は、以下をご覧ください。

Pen-Gesture (v1)

このバージョンは、「penetration_gesture」というタグを含む画像の生成を支援することを目的としています。残念ながらillustriousXLはこのタグを十分に理解できず、他のジェスチャー(「kitsune no mado」がよく出現します)や、最悪の場合、単語を分離してNSFWアートを生成してしまいます。

v1はこの問題を修正できます。当初の構想とは異なった形になりましたが、非常に効果的に機能しています。

元の計画は、「penetration_gesture」タグを「lefthandp3n」と「righthandp3n」という2つのタグで置き換えることで、より制御された出力を得ることでした。

しかし、わずか80枚のデータセットでは、非常に類似した2つの概念を別々のキーワードとして学習するには不足しており、この計画は早々に失敗しました。しかし、目標は達成されました。今はLoRAがこのジェスチャーを完全に理解しています。

LoRAを使用しない場合 vs LoRAを使用した場合

ご覧の通り、LoRAは効果的に機能しており(全体的にプラグアンドプレイに近いです)、ただし手に関連する部分では多少の調整が必要になることがあります(すべての手の生成に共通する課題です)。

ほとんどのテストはHassaku (Illustrious)を使用し、一部はWAI-NSFW-illustrious-SDXLで行いました。

私がよく使用した設定は以下の通りです:

Sampler: Euler A
Steps: ~28 ~32
CFG: ~6 ~6.4

画像はより良い最終結果を得るために、Upscalerとadetailerで処理しました。

Upscaler: YandereNeoXL_200k
steps:15
denoising:0.3

Adetailer:
face
fulleyesdetection

注意:adetailerは手の生成を支援するために使用していません <- ジェスチャーの結果は100%LoRAによるものです。

私が使用したプロンプトの構造は次の通りです:

{あなたのプロンプト}, righthandp3n, lefthandp3n <lora:Handp3n:1>

はい、両方のキーワードを使用する必要があります。

では、どうやって使いますか:

アクティブ化キーワード: righthandp3n, lefthandp3n
LoRAウェイト: ~1(1が最適値)

私はしばしば次のようなものをネガティブプロンプトに追加しました:"(fewer digits, extra digits,  4 fingers, 6 fingers)"(実際、これは別のユーザーのLoRAを試したときに残っていたものですが、必須かどうか不明なので、念のため記載しておきます)

注意:出力はCFGとステップ数によって大きく変化する可能性があります。気に入った画像が6本指になってしまった場合は、これらの設定を少しずつ調整すると、1〜2回の試行で希望の結果を得られます。

一般的には、私はステップを28、CFGを6に保ち、次のように試します:

まず同じシードでステップを30に変えてみます。それでも理想の結果でない場合、CFGを6.2または6.4に上げます。← ほとんどの場合、これで十分です。

十分にテストしましたか?まあ、私のGPUはフライパンとして使うには最適な選択肢でしたねxd。

最初のテストは解像度832×1216で実施し、前述の画像がそれです。

注:2つの提示画像の違いは、LoRAと2つのアクティブ化キーワードの有無だけです。

2番目のテスト(896×1152):

3番目のテスト(768×1344):

4番目のテスト(1024×1024):

5番目のテスト(1216×832):

6番目のテスト(1152×896):

7番目のテスト(1344×768):

最後で最も重要なテストは、既知のキャラクターを用いたテストです。 Fairy Tailのキャラクターを使っていくつかの画像を生成し、実験しました(簡潔にするため、キャラクターだけを変更して同じプロンプトを使用しました):

さらにいくつかの注意点:

  • 横長の解像度を使用する際は、このモデルが広い画像で学習されていないため、苦戦する可能性があることに注意してください(対策として、ネガティブプロンプトに「multiple_views」などのタグを追加して、「前後」のような画像を生成しないよう促してください)。

プロンプト作成の際、データセットは比較的バランスが取れていましたが、「ダークブルーの髪」の画像は一切含まれていなかったため、(シードやプロンプトによっては)1152×896のテストのように、髪の色が「ライトブルー」になってしまうことがあります。

すべてをご覧いただき、誠にありがとうございました(私は話が長く、不要な細部までついつい説明してしまう傾向があります)。このLoRAを楽しんでいただけたら幸いです。次回のモデルでもお会いしましょう。

このモデルで生成された画像

画像が見つかりません。