Six Views

このモデルはSDXL用のリコリスです。sdxxxl_v30チェックポイントで学習されました。

モデルはオンラインで見つけた42枚の画像で学習されました。可変解像度での学習はうまく行きませんでした。

画像は縦解像度1024にスケーリングされ、その後自動で分割・切り取り・再結合されました。

2048x1024の解像度で画像を作成します。

学習用のキャプションは以下の形式でした：

"sixviews, a women standing naked, [flat|small|medium|large] breasts, [color] [type] hair [with highlights]"

追加のキャプションはすべて最後に付け加えられ、画像から際立つ詳細を含んでいました。

例： "jewelery, moles, tattoo, tramp stamp, watermark"

推奨設定

このモデルは以下の設定で良好に機能します：

他の設定でも動作する可能性がありますが、上記設定で良い結果が得られました。

強み

ボディ、顔、胸、タトゥーの一貫性は良好です（完璧ではありません）。

モデルは約3％の確率で正しいポーズを達成します（1/40、3/100でテスト済み）。

さらに約5％の確率で、ほぼ正しいポーズを達成します。

水平解像度を下げると、ポーズのサブセットが得られることがあります。

モデルは被写体の複数の一貫したビューを生成できます。

弱み

ポーズが多すぎたり、少なすぎたりすることがあります。

ポーズが重複することがあります。

画像の解像度がSDXLの標準解像度の2倍であるため、処理速度が遅いです。

その他

「a blue haired women standing naked」とプロンプトすると、「a women standing naked, blue hair」と比較して一貫性が高くなります。

タトゥー（およびその他の詳細）は、異なるポーズ間で驚くほど一貫しています。

他の被写体（裸でない女性）でも動作します。

バージョン5

モデルの改善が可能であれば、新しいバージョンをリリースします。

おそらくこのモデルの次のバージョンはリリースされないでしょう。ポーズのサブセットを持つバージョンの方が可能性が高いです。