Fursuit Head LoRA for PonyXL
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
PonyXLモデル用Fursuit Head LoRA
PonyXLはフューリー服の概念は理解できますが、部分的なフューリー服やフューリー服の頭部の概念は理解できません。さらに、生成品質はたいてい不安定です。
このLoRAは、OneTrainerでProdigyを使用して、10エポック、2回繰り返し、さまざまな種類のフューリー服頭部をさまざまなポーズで着用している人の高品質画像76枚を用いて学習されました。マスク付き学習と強力な画像プロンプトを使用し、主にフューリー服頭部そのものの概念に焦点を当てました。
学習は、EverclearとPony Realismのカスタムモデルマージ上で行われました。
データセットは、リアル写真とイラストを50/50で構成しており、そのうちSFWとNSFWの比率は25/75でした。男性と女性を50/50にしようとしましたが、データセットは主に男性で構成されています。
推奨設定:
キーワード:
furryzsuithead mask
否定プロンプト:
Complex Mask, Feral
状況別否定プロンプト:
Tail, Gloves, Shoes, Paws, Anthro
推奨最小〜最大ウェイト範囲:
0.4 - 0.8
推奨精密ウェイト範囲:
0.55 - 0.75(プロンプトに応じて)
注意点と考慮事項:
XYプロンプトは推奨される否定プロンプトを使用して生成されていないため、例画像との品質差が生じています。
LoRAは、タグに「[種類] AND/OR [毛色/鱗色] furryzsuithead mask」と接頭辞を付けると、例画像に見られるように非常にうまく機能します。ただし、種類が非常にマニアックだったり、顔構造が「標準的」でないほど、準拠度は低下します(特に長い吻を持つ種類が最もよく機能します)。
学習時に「Mask」を分類子として使用したため、ベースモデルの「マスク」として関連付けられた色やスタイル(典型的なメキシコ風フェイスマスク)が、プロンプトに応じてにじみ出ることがあります。これは、より高いウェイト、色のプロンプト、否定プロンプトに「Complex Mask」を使用することで、比較的よく補正できます。
NSFW生成では通常「human」を肯定プロンプトに含める必要はありませんが、SFW生成では推奨否定プロンプトを使用しても人間ではなくぬいぐるみ動物を生成する傾向があります。そのため、肯定プロンプトに「human」を追加することが必要です。
私はLoRA学習に特に長けていないため、このLoRAは画像の構成を変更し、他の画像要素にも望ましくない形で影響を及ぼす可能性があります。ただし、ウェイトが低いほどその影響は小さくなります。
マスク付き学習は助けになりましたが、学習データが強力にプロンプト化されていたため、他のさまざまなプロンプトタグにもある程度の影響が出るとご理解ください。
このLoRAは現実的なモデルで学習されたため、非現実的なモデルをダウンロードしていないため、非現実的なモデルでもうまく動作するかどうかはわかりませんが、ご自身の結果をお知らせください。
上記の問題を改善するための提案、あるいは今後のリリースでの対応策があれば、ぜひお知らせください!
OneTrainerパラメータ:
LoRAランク:
128
LoRAアルファ:
2
ドロップアウト確率:
0.01
オプティマイザ:
Prodigy
スケジューラ:
Cosine
エポック:
10
1エポックあたりの繰り返し回数:
2
学習率(LR):
1
LRサイクル数:
1
バッチサイズ + 勾配蓄積:
1
テキストエンコーダーの学習停止エポック:
8エポック後
UNetの学習停止エポック:
常に学習
ノイズウェイト:
-0.1
ノイズバイアス:
0.45
マスク外ウェイト+確率:
0.09
MSE強度:
0.75
MAE強度:
0.25
損失重み関数:
Debiased Estimation
Prodigy設定:
Beta 1:
0.9
Beta 2:
0.995
EPS:
1e-08
重量減衰(Weight Decay):
0.005
デカップル(Decouple):
True
セーフガードウォームアップ(Safeguard Warmup):
True
バイアス補正(Bias Correction):
False
初期D(Initial D):
1e-06
D係数(D Coefficient):
1
成長率(Growth Rate):
inf
















