PinkiePie pony mix

詳細

ファイルをダウンロード

モデル説明

半リアル(2.5D)Pony-diffusionベースの混合モデル

これは、Pinkie Pie ポニー ミックスと名付けられたもう一つのオープン/フリーマージモデルです。

エアリー・アクセス

単なる楽しみでエアリー・アクセスを有効にしました :)

しかし、バズを寄付する必要はありません。7日後には自動的に利用可能になります!

バージョン説明

  • v2.2 - 高詳細、~ 2.5D

  • v3.3 - (v2.2 をベースに) - ~2.8D、コントラストが強く、詳細がやや少なめ、ハイレゾ対応が必要

  • v3.4 - (v2.2 をベースに) - ~2.8D、詳細を減らし、通常利用向け

  • v3.5 ALT - (v2.2 をベースに) - ~2.8D。テキストエンコーダーの問題を若干修正

  • v3.6 - (v3.5 ALT をベースに) - ~2.8D。顔とスタイルを若干修正

マージモデル

v1.0 のマージレシピ

Model Mixer https://github.com/wkpark/sd-webui-model-mixer を使用してすべてのモデルを1ステップで混合しています。レシピの詳細はモデルチェックポイントまたは一部の画像に含まれています。(Model-Mixer を使用することで、このレシピを簡単に利用・編集できます)

  • VAE 含む

  • 各バージョンのすべてのレシピがチェックポイントのメタデータに含まれています!

Model-Mixer 拡張機能付き sd-webui のスクリーンショット:

基本的なレシピは以下の通りです:

  1. ステップ #1:ベースモデル A + モデル B × 0.3 = mix_A(テキストエンコーダー除外)DARE 合成方法(Model-Mixer では簡略化された DARE 方法がサポートされています)

    - いくつかの試行錯誤の後、OUT01 の値を 0.3 から 0.1 に減量

  2. ステップ #2:ブロックレベル混合 - mix_A + モデル C = 最終マージ - DARE 合成方法

    - 解説:MID + OUT00~OUT08 ブロックのマージ

    - SDXL の OUT00 ~ OUT02 ブロックは、特に顔スタイルに大きな影響を与えます

    - 注:DARE 方法は内部でランダムピボットを使用するため、各マージプロセスで結果がわずかに異なる可能性があります

  3. 設定調整:これはモデルの詳細とトーンを最適化するための調整設定です。time_embed.* および out.* の重みを調整済み(詳細は https://github.com/hako-mikan/sd-webui-supermerger?tab=readme-ov-file#adjust を参照)!

推奨設定

有用な AUTOMATIC1111 webui 拡張機能

以下の sd-webui 拡張機能を推奨します。

チェンジログ

  • 2024/05/16 - 初回リリース

  • 2024/05/18 - v1.3 リリース(テキストエンコーダーの軽微な修正)(完全再構築)

    • 特定のテキストエンコーダー重みを yaminabepony の BASE に置換

      • BASE:layers.1.*, BASE:resblocks.5.* にバグがあり置換

      • その他の重みレベルのバグも近日中に修正予定☕👀

  • 2024/05/26 - v1.4 リリース(テキストエンコーダーの軽微な修正)(v1.0 + 追加テキストエンコーダー修正)

    • v1.4 = v1.0 + yaminabepony のテキストエンコーダーによる追加修正

      • BASE:layers.1.*:重み 1.0(DARE 合成)

      • BASE:resblocks.1.*:重み 0.2(DARE 合成)

      • BASE:resblocks:5.*:重み 1.0(DARE 合成)

  • 2024/06/08 - v1.5 リリース(テキストエンコーダーの軽微な修正)(明るさ調整追加)

  • 2024/06/08 - v1.6 リリース(テキストエンコーダーの軽微な修正)(v1.5 ホットフィックス)

  • 2024/06/08 - v2.0 リリース(「OUT08」ブロックレベル修正)(MIST チェックポイント使用、詳細強化)

  • 2024/06/13 - v2.1 リリース(調整パラメータによる詳細最適化)(MIST チェックポイント非使用)

  • 2024/06/15 - v2.2 リリース(テキストエンコーダー修正)(v2.1 + テキストエンコーダー修正)

  • 2024/06/21 - v3.0 リリース(顔スタイル修正)(v2.2 をベース + white_v2.0 モデルとのブロックレベルマージ + yaminabepony のv3ブロックレベルマージ追加)

  • 2024/06/29 - v3.1 リリース(顔スタイル修正)(さらにブロックレベル調整 + xxmix + mist モデルの追加マージ)

  • 2024/07/12 - v3.2 リリース(テキストエンコーダー修正)(text_l を MIST に置換、text_g を yaminabepony の token_embedding.weight で修正、調整詳細の軽微修正)

  • 2024/07/20 - v3.3 リリース。テキストエンコーダー修正 + 「リアル」および「写真」プロンプト用のブロックレベル Unet 修正(ハイレゾ対応を強く推奨)

  • 2024/07/21 - v3.4 リリース。v3.3 の詳細・ノイズを減らし、ハイレゾ非使用向けに最適化

  • 2024/08/03 - v3.5-alt リリース。「リアル」、「写真」プロンプト関連のテキストエンコーダー修正を試行

  • 2024/12/13 - v3.6 リリース(顔スタイルの軽微修正)(xxmix9 使用)

TODO

  • よりリアルな肌の色調を追加

  • 高詳細でのリアルさを向上するための調整パラメータ最適化(v2.x)

  • 西洋系顔スタイルの低減

  • よりアジア系顔スタイルの追加(v3.x)

  • 詳細レベルの修正(v2.x)

既知のバグ

  1. (v1.0~) 一部のプロンプトで、以下のようなズキズキした画像が生成される:

このエラーの原因は、元のモデルのテキストエンコーダー(この場合、RealDream Pony v2 が A1111 上でまったく同じエラーを発生)です。この問題は v1.2 マージモデルで若干修正されました。

  1. 一部のプロンプトワードは生成画像をややアニメ調・不自然に見せます:例)大きな目、笑顔、など

ライセンス

本モデルで使用したすべてのモデルは、「マージの共有時に異なる許可が適用される」ライセンスを有しており、追加の制限は設けていません。

オリジナルの Pony-diffusion v4 ライセンスは「同じライセンス制限」と明言しており、本モデルではその制限を超えて追加の制限を設けていません。(https://huggingface.co/AstraliteHeart/pony-diffusion-v4 および https://huggingface.co/spaces/CompVis/stable-diffusion-license をご確認ください)

CreativeML-Open Rail++-M

本モデルはユーザーに以下の権利を認めます:

✔ 作者のクレジットなしでモデルを使用

✔ 生成された画像を販売

✔ 画像生成を有料で提供するサービスで実行

✔ 本モデルを使用したマージモデルを共有

✔ 本モデルまたは本モデルを用いたマージモデルを販売

❌ マージの共有時に異なる許可が適用される

具体的には、OpenRAIL-M ライセンスは、ユーザーが生成した画像に対する権利を保有し、商業目的でこれらの画像を使用できることを許可しています。(Stable Diffusion)(Baseten)このオープンさは、創造的なプロジェクトから商業サービスまで幅広い用途を可能にし、企業や個人がモデルの機能をさまざまな目的に活用できるようにします。

したがって、商用製品やサービスとして Stable Diffusion を使用することを検討している場合、ライセンスで定められたガイドラインと制限を遵守すれば、その使用は許可されています。(ChatGPT より)

サポート

私の作業を気に入っていただけたら、ko-fi でコーヒーを一杯ご馳走してください。https://ko-fi.com/mixboy

このモデルで生成された画像

画像が見つかりません。