Six Views

詳細

ファイルをダウンロード

モデル説明

このモデルはSDXL用のリコリスです。sdxxxl_v30チェックポイントで学習されました。

モデルはオンラインで見つけた42枚の画像で学習されました。可変解像度での学習はうまく行きませんでした。

画像は縦解像度1024にスケーリングされ、その後自動で分割・切り取り・再結合されました。

2048x1024の解像度で画像を作成します。

学習用のキャプションは以下の形式でした:

"sixviews, a women standing naked, [flat|small|medium|large] breasts, [color] [type] hair [with highlights]"

追加のキャプションはすべて最後に付け加えられ、画像から際立つ詳細を含んでいました。

例: "jewelery, moles, tattoo, tramp stamp, watermark"

推奨設定

このモデルは以下の設定で良好に機能します:

  • 強度:0.8–1.0
  • CFG:4
  • ステップ数:30
  • 解像度:2048x1024
  • DPM++ 3M SDE Karras

他の設定でも動作する可能性がありますが、上記設定で良い結果が得られました。

強み

ボディ、顔、胸、タトゥーの一貫性は良好です(完璧ではありません)。

モデルは約3%の確率で正しいポーズを達成します(1/40、3/100でテスト済み)。

さらに約5%の確率で、ほぼ正しいポーズを達成します。

水平解像度を下げると、ポーズのサブセットが得られることがあります。

モデルは被写体の複数の一貫したビューを生成できます。

弱み

ポーズが多すぎたり、少なすぎたりすることがあります。

ポーズが重複することがあります。

画像の解像度がSDXLの標準解像度の2倍であるため、処理速度が遅いです。

その他

「a blue haired women standing naked」とプロンプトすると、「a women standing naked, blue hair」と比較して一貫性が高くなります。

タトゥー(およびその他の詳細)は、異なるポーズ間で驚くほど一貫しています。

他の被写体(裸でない女性)でも動作します。

バージョン5

モデルの改善が可能であれば、新しいバージョンをリリースします。

おそらくこのモデルの次のバージョンはリリースされないでしょう。ポーズのサブセットを持つバージョンの方が可能性が高いです。

このモデルで生成された画像

画像が見つかりません。