WhiteXL_realisticMix
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
モデル説明:現時点での実際のテストでは安定性はまだ不十分ですが、良い画像を生成できます。このモデルはLoRAを用いたフュージョンベースモデルではなく、そのため制作コストが非常に高額です。気に入っていただけたら、ぜひ五星評価をお願いします。心より感謝します。
768解像度の大量データで一度学習し、その後1024の小規模データでさらに学習しました。
したがって、出力解像度に厳密な制約はありません。アートセットにはさまざまな解像度が含まれますが、1280以下が最適です。推奨解像度は768~1024です。
CFGは4~6の範囲に調整してください。XLのベースの適合度は非常に高いため、学習後はCLIPが過学習しやすくなります。CFGは適度に下げてください。
リドローの強度は0.3~0.4に抑えてください。過剰なリドローは人物が2.5D的に歪む原因になります。これは、XL自体のデータ量が多すぎるため、私の学習量では元の多くの概念を十分に洗い流せないためです。
使用推奨:このモデルを基盤として、本物の人間のLoRAを追加で学習することを推奨します。これにより、小さなコンセプトでも画像品質が大幅に向上します。
学習プロセス:このモデルは5万枚の画像で約100万ステップ学習し、その後小規模なデータセットで複数回追加学習しました。合計で約150万ステップを実行しました。学習時間の長さとハードウェアコストが膨大なため、個人の負担が限界に達したため、途中で学習を終えました。さらに、realvisxlV20_v20Bakedvaeモデルの15%とSDXL_xxmix9realisticsdxl_v10の10%を混合しました。現時点で観察されたところ、学習量はまだ期待に遠く及ばず、XLを大規模なデータで洗い流さなければ、1.5のリアルな写真の安定性を達成するのは非常に困難です。ただし、現時点での結果は十分に楽しめるレベルです。
今後の計画:XLの学習コストが非常に高いため、愛で動かすだけでは継続が困難です。したがって、このモデルは短期間はこのバージョンのみとなります。今後、私が豊かになったり、支援者から資金提供を受けてさらに深く研究・学習を進められる場合は、更新を継続します。貧困な家庭出身のため、ご理解いただけますと幸いです(もちろん、支援してくれるスポンサーがいらっしゃいましたら、いつでもご連絡ください)。
B站ID:呪術師老白













