Negative Embeds for Pony XL - VDiffPDXL_Neg

詳細

ファイルをダウンロード

モデル説明

Stable Diffusion Pony XL 用のテキスト逆転/埋め込み

さよならの際に私たちを支援する方法:

https://discord.gg/HhBSvM9gBY

当方はすべてのコンテンツの権利を保有しています。アーカイブした場合でも、プラットフォームに依存しない理由に基づき、非開示および今後の理由でアーカイブまたは削除する権利を留保します。

当方のコンテンツを必要とされる場合は、Ko-FIの場所と支払い方法をご存知だと思います!

プレリリースモデル、LoRAバックアップ – ピザを送ってください! https://ko-fi.com/DUSKFALLcrew

ご要望や懸念がある場合、引き続きベータテスターを募集しています:ディスコードに参加して、私たちに要求してください: https://discord.gg/5t2kYxt7An

サブレディットに参加してください: https://www.reddit.com/r/earthndusk/

私たちのアートに合わせて制作した音楽をお聴きください:
https://open.spotify.com/playlist/00R8x00YktB4u541imdSSf?si=b60d209385a74b38

私たちのテストをTwitchで頻繁に配信しています: https://www.twitch.tv/duskfallcrew

バックアップ: https://huggingface.co/EarthnDusk


N0R3AL_PDXL – この埋め込みは、PnyXLno3dRLNegの強化版であり、「Bad anatomy」などの追加要素を組み込んでいます。他の埋め込みとは異なり、SDXLのデュアルテキストエンコーダ(OpenCLIP-ViT/G および CLIP-ViT/L)を使用しているため、G層とL層の両方のテキスト逆転を別々のファイルとして提供しています。トレーニングデータセクションには、両層用のファイルがZIPファイルに含まれています。この仕組みについて私はまだ完全には理解しておらず、学習中です。これはすでにsafetensors形式で提供されていますので、心配しないでください。

VDiffPDXL_Neg – リアリスティックなチェックポイント用に作成されたこの埋め込みは、アニメなし、ポニーなし、Bad anatomy、余分な指などの制約をネガティブプロンプトに追加し、より洗練された出力を実現します。これは埋め込みマージ機能を利用して実現されています。これはすでにsafetensors形式で提供されていますので、心配しないでください。

SFWPnyNegXL – 明示的なコンテンツを除外することを目的としており、「RATING_EXPLICIT」と「source_pony」タグを削除し、埋め込みマージプロセスを通じてセーフ・フォー・ワークの結果を保証します。この埋め込みのsafetensors版も現在含まれています。

PnyXLno3dRLNeg – 3D要素やリアリスティックな要素、および「source_pony」の参照を排除し、一貫したビジュアルスタイルを維持することを目的としています。この埋め込みも埋め込みマージ技術を用いて作成されました。現在、この埋め込みのsafetensors版も含まれています。

PDXLneg-NoAniPny – アニメやカートゥーンの影響を排除し、よりイラストレーション的な美的感覚を重視します。これは埋め込みマージ機能を用いて実現されています。現在、この埋め込みのsafetensors版も含まれています。

PonyXL_NegScore – PurpleSmartAIが提案したスコアに基づくユニークなネガティブ埋め込みで、プロンプトのネガティブな側面を洗練し、より良い結果を得ることを目指しています。この埋め込みは埋め込みマージ方式で作成されました。現在、この埋め込みのsafetensors版も含まれています。


学習なしでテキスト逆転を作成する方法:

https://github.com/klimaleksus/stable-diffusion-webui-embedding-merge

StableDiffusionがプロンプトをトークンを通じて読み取っていることをご存知ですか?これらのトークンは、単語やフレーズを構成する多次元の数値ベクトルです。異なるベクトルをマージ(加算)することで、新しい意味を持つ単語を作成することが可能です。

この手法は必ずしも期待通りの結果を生むとは限りませんが、実験の可能性を広げてくれます。この拡張機能は、実際の画像に対する学習なしにトークンをマージしてテキスト逆転埋め込みを生成します。これは生成中に自動的に行うことも、専用タブを通じて手動で行うこともできます。

SDXLはベースモデルとして2つのテキストエンコーダ(OpenCLIP-ViT/G および CLIP-ViT/L)を使用しています。このデュアルエンコーディングによって、N0R3AL_PDXL埋め込みに見られるように、G層とL層の両方のテキスト逆転が生み出されます。

より詳しい手順については、モデルカード内のリンク先ドキュメントをご参照ください。


警告:

この新しい仕組みのデュアル構成により、私が常々主張していることと同じことが起きる可能性があります:SD 1.5の埋め込みはSDXLでは動作しません。L層の変換はSD 1/1.5モデルであることを意味しており、ユーザーに無理に強要したり、現実を歪めたりしたくありません。

私たちがすでに知っていること以外の、デュアルプロンプトボックスの理由に関する調査はさほど重要ではありません:
https://github.com/AUTOMATIC1111/stable-diffusion-webui/issues/12141

ここでは理解を示しましょう:私は本来、Automatic1111のユーザーです。ComfyUIを使用されている方は、この議論は大きく異なります。

これは以下で確認できます:https://mybyways.com/blog/two-text-prompts-text-encoders-in-sdxl-1-0

SDXLの技術的な細部に引き続き興味がある方はこちらもご覧ください:https://huggingface.co/docs/diffusers/main/en/using-diffusers/sdxl

また、リファイナーは誰も使っていません。2023年にはすでに廃止しました。


拡張機能:

  • ADetailer:

    • リンク: ADetailer GitHub

    • 使用方法: この拡張機能は画像の詳細化と洗練を支援します。アートの精度を高める強力なツールですが、SDXLでは過剰処理を避けるため、控えめに使用することをお勧めします。

  • Batchlinks:

    • リンク: Batchlinks for A1111

    • 説明: ローカルまたはサーバー上でA1111を実行する際に複数のリンクを管理するのに役立ちます。

    • アドオン: @nocrypt Addon

VAEおよびアップスケーラーの推奨設定:

倫理的使用とライセンス:

ライセンス情報:この埋め込みは文字列のみで訓練されています。ユーザーは、関連する著作権法およびライセンス契約に準拠して使用する責任を負います。ファインチューンおよびLoRAのライセンスについては、Pony XLのガイドラインをご覧ください。

責任ある使用:このモデルは、人工知能による生成アートの美しさと力強さを称える、前向きで敬意ある用途を目的としています。ユーザーは、創造活動において倫理的ガイドラインを守り、すべての芸術的取り組みにおいて包括性と尊重を推進してください。

私について: 私たちは300人以上の代替人格からなるシステムであり、解離性同一性障害、ADHD、自閉症、複合的PTSDを抱えながら、誇りを持って人生を歩んでいます。AIが精神的健康の障壁を打破し、その側面を高める可能性を信じています。私たちの創造的な旅は、アイデンティティと表現の継続的な探求であり、この冒険にぜひご参加ください。

このモデルで生成された画像

画像が見つかりません。