Six Views
詳細
ファイルをダウンロード
モデル説明
このモデルはSDXL用のリコリスです。sdxxxl_v30チェックポイントで学習されました。
モデルはオンラインで見つけた42枚の画像で学習されました。可変解像度での学習はうまく行きませんでした。
画像は縦解像度1024にスケーリングされ、その後自動で分割・切り取り・再結合されました。
2048x1024の解像度で画像を作成します。
学習用のキャプションは以下の形式でした:
"sixviews, a women standing naked, [flat|small|medium|large] breasts, [color] [type] hair [with highlights]"
追加のキャプションはすべて最後に付け加えられ、画像から際立つ詳細を含んでいました。
例: "jewelery, moles, tattoo, tramp stamp, watermark"
推奨設定
このモデルは以下の設定で良好に機能します:
- 強度:0.8–1.0
- CFG:4
- ステップ数:30
- 解像度:2048x1024
- DPM++ 3M SDE Karras
他の設定でも動作する可能性がありますが、上記設定で良い結果が得られました。
強み
ボディ、顔、胸、タトゥーの一貫性は良好です(完璧ではありません)。
モデルは約3%の確率で正しいポーズを達成します(1/40、3/100でテスト済み)。
さらに約5%の確率で、ほぼ正しいポーズを達成します。
水平解像度を下げると、ポーズのサブセットが得られることがあります。
モデルは被写体の複数の一貫したビューを生成できます。
弱み
ポーズが多すぎたり、少なすぎたりすることがあります。
ポーズが重複することがあります。
画像の解像度がSDXLの標準解像度の2倍であるため、処理速度が遅いです。
その他
「a blue haired women standing naked」とプロンプトすると、「a women standing naked, blue hair」と比較して一貫性が高くなります。
タトゥー(およびその他の詳細)は、異なるポーズ間で驚くほど一貫しています。
他の被写体(裸でない女性)でも動作します。
バージョン5
モデルの改善が可能であれば、新しいバージョンをリリースします。
おそらくこのモデルの次のバージョンはリリースされないでしょう。ポーズのサブセットを持つバージョンの方が可能性が高いです。
















