Oatd Style

詳細

ファイルをダウンロード

モデル説明

これは比較的汎用的なピンアップ(単一の女性被写体)LoRAです。西洋のカートゥーンとアニメスタイルのハイブリッドを生成します。このモデルは、アーティストWoot1枚の画像(注意:NSFW)を用いて訓練された(現時点で非公開の)Ponyモデルから派生しました。その後、AutismMixを使って、その画像の被写体を含まない例を生成し、得られたスタイルが気に入ったため、このモデルを作成しました。このスタイルは、確かに一部の要素(特に目)を含んでいますが、本物のWootのスタイルとは大きく異なります。そこで、私はランダムな新しい名前「Oatd」を考案しました。

さらに、訓練中に(新規の?)テクニック「キャプション拡張」を使用しました。3つの「レベル」のキャプション詳細度を用意し、それらをすべて同時に訓練しました。その結果は私の予想をはるかに上回るものでした。このモデルは、どのレベルのキャプション詳細度に対しても非常に優れています。添付された訓練データは、キャプション詳細度の3レベルに対応する3つのフォルダに整理されており、訓練前にこれらを統合する必要があります。

このモデルは幅広いプロンプトスタイル(ただしBooruスタイルのプロンプトを推奨)に対応可能で、特定のトリガー単語は必要ありません。ただし、低詳細度キャプションスタイルで頻繁に使用された特定のプロンプトは特に効果的であるため、最良の結果を得るにはそれらを一般的に含めるべきです。

woman - すべての訓練データにこのキャプションが含まれているため、最良の結果を得るには含めることが推奨されます。

from front/from side/from behind - 適切な角度を得るために、これらのオプションのいずれか1つを選択してください。デフォルトでは広くfrom frontを好みます。

indoors/outdoors/simple background - 適切な全体的な設定を得るために、これらのオプションのいずれか1つを選択してください。デフォルトではsimple backgroundを好みます。設定をより具体的に記述すれば、モデルはその意図を捉え始めるはずです。

低詳細度キャプションスタイルには、衣装、体の姿勢、体形に関する基本情報も含まれているため、これらのキャプションも推奨されます。これらのキャプションのいずれかを省略しても、問題なく動作します。

一方で、高詳細度キャプションスタイルでは色の分離をうまく学習しており、服、髪、目などの色を正確に保持する能力に優れています。

もう1つの注目すべきキャプションはface focusで、これはキャラクターの顔のクローズアップを生成します。インペイントに有用です!

このモデル自体は非常に汎用的で、プロンプトの内容に応じてSFWまたはNSFWの出力を生成できます。含まれる訓練データの一部はややNSFWで、裸体や不自然な女性の体型が含まれていますが、性行為の描写は含まれていません。デフォルトではSFWからややセクシーなレベルまでをカバーしています。

推奨解像度は1024x1024または1024x1536ですが、ハイレゾ修復を1.5に設定すると通常効果的です。

このモデルで生成された画像

画像が見つかりません。