Escape XL (Pony)
詳細
ファイルをダウンロード
モデル説明
風景コンテストに遅すぎないといいのですが…
新しいEscapeXLモデルを紹介します! このチェックポイントは、PonyXLを微調整したもので、圧倒的な風景と詳細な風景画を再び生成できるようにし、キャラクターとも良好に統合できるように設計されています。当初はLoRAとして訓練されましたが、Lightning重みを用いた標準的な微調整によりはるかに優れた結果を得られました。約200枚の画像で訓練されています。
このモデルは、お気に入りのPonyXL LoRAとも互換性があります!
現在このモデルはベータ版です。完璧ではありませんが、風景描写には優れているため、風景コンテスト向けに早期リリースとして公開しています。キャラクターやNSFWについては普通のレベルです。皆さんが気に入っていただければ、1000枚以上の画像、新規コンセプト、そして最も美しい風景を表現するためのより良い自然言語サポートを備えたv1.0を訓練します。
v1.0の開発予定リスト:
より多くのバイオーム:宇宙、水中、室内、都市…
人間を含まない新たなコンセプト:車両、建築物、オブジェクト…
風景の説明とBooruタグに対する、より良い自然言語サポートの可能性。
PonyXLの解剖学的問題と「忘れられた知識」の修正。最終目標は、キャラクターと風景を両方とも良好な構図で扱えるようになることです。
ご提案歓迎!
このモデルの使い方
チェックポイントをダウンロードして、チェックポイントフォルダ(Stable Diffusion)に配置してください。
推論(画像生成)用のおすすめパラメータ:
Clip Skip: 2
Sampler: DPM++ SDE
Steps: 約15
CFG Scale: 約2.0
ポジティブプロンプト:
score_9, score_8_up, score_7_up, score_6_up, <あなたのプロンプト>
ネガティブプロンプト:
score_6, score_5, score_4
風景用トリガーワード:
scenery
landscape
no humans
このモデルは一定程度、自然言語プロンプトを理解できます。
人物やキャラクター画像を生成する場合は、CFGとStepsを下げるとよいでしょう。
注意点
このチェックポイントは、人物やキャラクターの画像に対してあまり訓練されていないため、ベースのPony XLモデルと同様に「野生的なスタイル」の問題が発生する可能性があります!安定性を確保するには、LoRAと一緒に使用することをお勧めします。また、他のPony派生モデルのようにNSFWや複雑なポーズを得意とするわけではなく、これらはv1で改善される予定です。
技術仕様
1xA40で訓練
このプロジェクトの背景と動機
PonyXLは、複雑なキャラクターや状況を描くことに優れた素晴らしいチェックポイントです。その解剖学的理解度は、NSFWシーン用の最高モデルの一つである可能性があります。しかし、ほとんどのデータセットはヒューマノイドキャラクターの描写に焦点を当てており、広範な微調整によって、元のモデルが習得していた概念が部分的に「消去」または置き換えられた可能性があります。また、初期のテキストエンコーダーの訓練も大きく変更され、Booruタグ(少なくとも50%はこの種の記述構文)しか理解できなくなった可能性があります。
そのため、Pony XLだけでキャラクター以外のものを表現するのは、LoRAや他の拡張機能を使わないと難しい場合が多いです。ベースモデルだけでは、一貫性があり、審美性の高い風景を生成するのはさらに困難です。
このプロジェクトの目的は、Pony XLが風景、バイオーム、夜景、車両、オブジェクトなど、既存の能力に加えてそれらの概念を描けるようにし、キャラクターだけでなくシーン全体の重要性を高めることです。これは非常に大きな課題を伴います:
既存の能力を損なわずにどうすればよいのか?
LoRAがPony向けに作られたまま機能するよう、元のモデルにどれだけ近づけるか?
このモデルでこれらの問いに答えようとしています。現在のところ、完璧ではありません:環境の描写には優れていますが、過学習に陥ることがあり、解剖学の扱いではPonyよりも劣るようになりました。次のバージョンでははるかに改善されます。
このモデルには保証が付いていません。不適切な用途には使用しないでください。
ヒント:
目などの小さな問題は、inpaintやhires fixを使うことで簡単に修正できます。




















