Internal vore
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
このモデルは、JollyLMが内部で作成したLoRAと類似していますが、こちらは同じ画像内に捕食者と獲物の両方を生成することに焦点を当てています。
概念はよく理解されていますが、内部部分を正確に描くには、しばしば複数の世代を経る必要があります。この部分はプロンプトの影響をあまり受けないため、結果はかなり不安定です。完璧とは言えませんが、この概念はAIにとって解剖学的に非常に難しいものです。ただし、本当に必要ならば、ノイズ除去強度を約0.6にして内部部分だけをインペイントすればうまくいくかもしれません——私は試したことがありません。
このモデルは多様なチェックポイントや美的スタイルと比較的互換性がありますが、生成時に自らのスタイルを強く押し出す傾向があります。他の私のモデルと同様に、特定のアイデアや構図がうまく描画されない場合は、そのLoRAが高品質で生成できないものである可能性があります。
トリガーワードは「internal lora」です。長いプロンプト、特に要素に強調(1.2、1.3…)が含まれる場合、このトリガーの強度を上げる必要があります。そのため、私の多くの例では、プロンプティングを可能な限り簡素に保つようにしました。しかし、あなたの方がこの点でより成功する可能性があります。
入力として「1 character」または「2characters」に違いがあるかは不明ですが、このLoRAは複数の獲物タイプ、さらには複数の捕食者を含む画像を生成できます。ただし、これは不安定で、どのようにこれら2つが区別されているのか、私も常に確信できません。
プロンプティングの際、主に捕食者(メインキャラクター)に影響を与え、獲物はしばしば裸で、苦しんでいるか怖がっているように描かれます。これは概念の理解の仕方によるものです。獲物の顔に「大きく開いた目で泣いている」といったプロンプトを加えると効果的だと感じますが、捕食者には影響しません。しかし、その結果、獲物の外見を調整するのが難しくなります。
Latent Coupleを使うと、この点についてより制御できる可能性がありますが、私はそれについて詳しくなく、試したことはありません。
少し、マンガのようなスタイルを得るためにモノクロの画像を生成してみました。うまく機能しているように感じます。
Euler aを20ステップで使用すると、ほとんどのモデルで一般的に良好な結果が得られます。私はノイズ除去強度0.2でR-ESRGAN 4x+をアップスケーラーとして使用しています。それ以外の設定では画像が極端に歪んでしまいます。
多くのネガティブプロンプトを設定していますが、これらは必須ではありません。Easynegativeはおそらく必要ですが、他のものはよくわかりません。私は念のためそれらをすべて追加しています。
このLoRAを私は作成しましたが、実際に使用する専門家ではありません。どうぞ、あなたの最高の結果を共有してください。私もそこから学びたいと思います。















