SuperMix

詳細

ファイルをダウンロード

モデル説明

🍍 SuperMixは、アニメに焦点を当てたテキストから画像を生成するDiffusionモデルで、詳細な描写、照明、テクスチャ、構成の他の要素を通じて、半現実的なトーンを引き出します。同時に、この統合モデルは、選択したパラメータを通じて生成可能なスタイル、フォーム、メディアの量において非常に汎用性があります。SuperMixは以下に優れています:

  • ポートレート

  • アニメ

  • 半現実主義

  • 風景

  • コンセプトアート

  • 詳細なテクスチャ

  • 詳細な背景

  • 車両、建築、食べ物

  • その他!

このモデルは、さまざまなアニメ専用モデルを無作為に組み合わせたことで始まりました。私はそのマージによって出色した細部に注目し、それらを強調する形でさらに体系的なミックスを構築することに決めました。いくつかの反復とブランチテストを経た後、このミックスは十分に完成度が高く、過度なバリエーションを加えることなくそのまま他者と共有できることを確認しました。

私はまだ生成アート全般について比較的新しい立場であり、修正や改善すべき点があれば、ぜひお知らせください 👌

このモデルの出力を使って誰かが何を生み出すか、ぜひ見たいと思っています。何かを投稿する際には、#SuperMixというタグを各種プラットフォームで自由に使用してください!

注意

SuperMix1は、2022年末に当時知られていた複数のモデルを粗くマージして作成された旧モデルです。そのため、このモデルおよびそのマージ構成要素は比較的古く、現在のWebUIのアップデートなどにより、管理が難しい場合があります。現在、同様のスタイルと柔軟性を備えた優れたモデルが多数存在しており、あなたのスタイルの好みに応じて使いやすいものが多いでしょう。このモデルに今後アップデートがある場合、新しいバージョンでは本バージョンの主要な問題を修正し、ライセンス制限を除去し、より高い水準にファインチューニングすることを目的とします。

💡 代替バージョン、モデルレシピ、その他の情報はHugging Faceページでご確認ください。


一般的な使用法

このモデルは、一般的な設定とパラメータにおいて非常に汎用性が高いです。
簡単に言えば、シンプルな状態から始めて、そのときのあなたのプロンプトに最も適したものを試すことをお勧めします。過去のプロンプトや設定を試してみるのもよいですし、ゼロから始めても構いません。このモデルは良いプロンプトで大きく輝きます。良い設定+プロンプトを見つけるまでは、解剖学的な不正確さや手の描写が乱れることがあるかもしれませんが、それを見つけたときは明らかにわかるでしょう。このモデルは主にポートレートスタイルの生成を目的としています。

プレビューおよび例のセクションにはさまざまな設定の例が多数ありますので、自分のスタイルを自由に探求してください。SuperMixは非常に強力なモデルで、多様なスタイルに対応できます。自分が最も効果的だと思った使い方を躊躇せずに試してください。

生成後のimg2imgによるアップスケーリングを、低いノイズ除去値で実行すると、出力画像のクリアな仕上げに非常に効果的です。ただし、パラメータによっては非常に細かいディテールが失われる可能性があります。その場合は、2つのアップスケール結果をマージして、両方の長所を活かす方法もあります。

~20 ステップ、7 スケール、**~0.4_** ノイズ除去、clip skip 1 または 2_ が良い出発点です。

このモデルはディテールの正確性にやや問題がありますが、主にポートレートスタイルを対象としています。プロンプトや他のパラメータによっては、手や解剖学的描写が時折不自然になることがあります。


プロンプト

SuperMixはシンプルなプロンプトも複雑なプロンプトも両方とも優れた結果を出せます。シンプルで短いプロンプトから始め、そこから拡張してください。👑 私の意見では、生成における最大の要因の一つはプロンプトです。使用している内容とその使い方、他の要素との競合、すべてのパラメータがどのように相互作用するかに注意を払ってください。(例:サンプラー、ステップ数、スケール、clip skip、シード、LoRAなど)

注意:アーティストトークンは出力に大きな影響を与える可能性があります。各自の判断で使用してください。

ポジティブプロンプト:スタートとしてはシンプルなものが十分ですが、構造を追加することでモデルのスタイルをさらに明確に導くことができます。他のパラメータとよく合うものを試してください。以下にいくつかの例を示します。

(masterpiece:1.1), (highest quality:1.1), (HDR:1.0)
extreme quality, cg, detailed face+eyes, (colorful:0.8), <content>, masterpiece, 8k, tone mapping, hyper focus

ネガティブプロンプト:このモデルはシンプルなネガティブプロンプトやネガティブ埋め込みで十分に機能しますが、スタイルの方向性や望ましくない品質など、ネガティブプロンプトに構造を持たせることでさらに良い結果を得られます。ポジティブプロンプトと矛盾するトークンに注意し、あまり複雑にしすぎず、うまくいくものを試してみてください!

(bad quality:1.3), (worst quality:1.3)
EasyNegative, (bad_prompt_version2:0.8), (badhandv4:1.18), (bad quality:1.3), 
(worst quality:1.3), watermark, (blurry), (cropped), (nsfw:1.3), (cleavage:1.3)

さらに例はプレビュー画像をご覧ください。

Hires Fix

  • Hires Denoising:私は通常~0.3-0.6の範囲を使用しています。それ以外はあまり試していませんので、現在のパラメータやプロンプトに最も適した値を試してください。

  • Hires Upscaler:アップスケーラーごとにやや異なる結果が得られますが、どれも問題なく動作します。一般的に使用されるものについては不明ですが、私は主にR-ESRGAN 4x+ Anime6Bまたは4x-UltraSharpを使用しています。いつも通り、自分に最適なものを選んでください。

サンプリングステップ

~18-30のステップ値から始めるのをおすすめします。プロンプトやサンプラー、その他のパラメータに合わせて、より低くしたり高くしたりして試してください。

サンプラー

このモデルの試行では、主に以下のサンプラーを使用しました:

  • Eular a

  • DPM++ 2M Karras

  • DPM++ SDE Karras

  • DDIM

また、DPM++ 2S a KarrasPLMSサンプラーも少し試しました。
その他については不明です。各サンプラーはスタイルが異なり、プロンプトや他のパラメータと異なる反応を示します。

普段使っているサンプラーを試した後、他のサンプラーも試し、他の設定やプロンプトとの相性を確認してみてください。

各サンプラーはプロンプトや他のパラメータの特定のトークンを異なる方法で処理する可能性があります。あるサンプラーと「プロンプトA」で良い結果が出る一方、別のサンプラーと「プロンプトB」でより良い結果が出る可能性があります。

スケール

CFG Scaleはプロンプトやサンプラーなどに大きく依存します。一般的にはデフォルトの7から始め、~6.5-10の範囲で調整することをおすすめします。

例としてDDIMサンプラーでは、プロンプトや他の要因に応じて、~13-16のような高めのスケールでも良好な結果が得られました。ただし、低めの値でも十分に機能します。他のサンプラーと値の範囲にも同様のことが言えます。
自分とプロンプトに最も合った設定を試してください 👍

Clip Skip

  • Clip Skip 1:ほとんどのサンプラーに適しており、私の経験ではEuler aと特に相性が良いです。

  • Clip Skip 2:ほとんどのサンプラーに優れており、サンプラーや他のパラメータによってプロンプトのトークンをより「文字通り」に解釈します。

どちらも優れた結果を出し、それぞれ異なるスタイルと結果を生み出します。これが、他のテストモデル変種を採用しなかった理由の一つです(Clip Skipの2つのバリエーション間で品質に偏りがあったため)。両方を試すか、組み合わせて、組み込みのX/Y/Zプロットスクリプトで同時に使用することをおすすめします。

さらに高い値(Clip Skip 3-6)も試してみてください。良い結果が得られた例があります。

VAE

好みのVAEをご使用ください。私は通常vae-ft-ema-560000-emaを使用します。

  • "SuperMix_A.vae"(リネーム済み:SD vae-ft-ema-560000-ema.vae)
     推奨:明るく鮮やかで力強い色調

  • "SuperMix_B.vae"(リネーム済み:kl-f8-anime2.vae、Hugging Faceページより入手)
     非常に類似:時折異なるディテール

  • "SuperMix_C.vae"(リネーム済み:Anything_v3.vae、Hugging Faceページより入手)
     別の選択肢:比較的控えめな色調・彩度

vae-ft-mse-840000-emaおよびClearVAE_V2.3も良い選択肢です。

注意:モデル名に"-bv"または"-bakedVAE"を含むものは、VAEファイルが組み込まれているため、これらのファイルを使用する必要はありません。

アップスケーリング

生成後の二次的なimg2imgアップスケーリングは、このモデルの画像の明瞭さを引き出し、ディテールを整えるのに非常に効果的です。ただし、設定によってはテクスチャの細部がやや柔らかくなる可能性があります。もちろん必須ではありませんが、生成結果をはっきりとシャープに仕上げるのに役立ちます。自分に最も合った設定や拡張機能をご使用ください。

私は以下のように、組み込みのSDアップスケールスクリプトをよく使用します:

  • 同じベースモデル

  • 同じまたは類似したプロンプト

  • DPM++ SDE Karrasサンプラー

  • 20ステップ

  • 7CFGスケール

  • 低いノイズ除去値~0.08-0.3

  • ランダムシード**-1**

  • タイル重複~176-208

  • スケールファクターx2

  • アップスケーラー:R-ESRGAN 4x+ Anime6Bまたは4x-UltraSharp

  • LoRaは通常オフ

ENSD & Eta

私はWebUIのデフォルト設定のみを使用しています:

  • 0 Etaノイズシード差分

  • 0 DDIM用Eta(ノイズ倍率)

  • 1 祖先サンプラー用Eta(ノイズ倍率)

その他の設定

例画像では、次の設定を使用しました:
settings/compatibility/use old karras scheduler sigmas (0.1 to 10) という互換性設定(Karrasサンプラーに影響します)。これは完全にオプションであり、通常必要ありません。この設定は、古いWebUIバージョンの挙動をより正確に再現します。この設定を無効にした場合の、新しいWebUIバージョンでのテストは十分に行いませんでした。

免責事項

このモデルは、使用するパラメータによって意図せずNSFWコンテンツを生成することがあります。プロンプトを適切に調整してください。たとえば、ネガティブプロンプトに"nsfw"を含めるなど。

このモデルを共有する目的は、公共の場で露骨なコンテンツを提示することではありません。この学習モデルの利用はユーザーの裁量に委ねられており、SFWまたはNSFWコンテンツの作成を自由に選択できます。SFWまたはNSFWコンテンツとの関わりは、ユーザー自身の個人的好みに委ねられます。AIモデルには、簡単にアクセス可能な明示的なビジュアルコンテンツは含まれていません。

使用した例画像

  • vae-ft-ema-560000-ema VAE

  • 4x-UltraSharpまたはR-ESRGAN 4x+ Anime6Bアップスケーラー

  • hires fixを使用し、SD upscaleでさらにアップスケール

  • **use old karras scheduler sigmas (0.1 to 10)**互換性設定

  • 使用したすべてのLoRaは画像メタデータに記載されていること

  • Bad_v2ネガティブ埋め込みは、bad_prompt_version2と同名である必要があります

  • EasyNegativebadhandv4のネガティブ埋め込みも使用

*ネガティブ埋め込みはオプションです

注意

SuperMix1は、Automatic1111 WebUIの非常に古いバージョン(https://github.com/AUTOMATIC1111/stable-diffusion-webui/tree/4b3c5bc24bffdf429c463a465763b3077fe55eb8)でマージおよびテストされました。そのため、Karrasサンプラーを使用する場合や例画像を再現したい場合は、→ settings/compatibility/use old karras scheduler sigmas (0.1 to 10) 互換性設定を有効にすることをお勧めします。これは完全にオプションであり、通常必要ありません。この設定を無効にした場合の、新しいWebUIバージョンでのテストは十分に行っていません。

ライセンスと使用

このモデルはオープンアクセスで、誰でも利用可能であり、Modified CreativeML OpenRAIL-Mライセンスにより、権利と使用方法が明確に規定されています。

1. モデルを利用して、違法または有害な出力やコンテンツを意図的に生成・共有することはできません。

2. 作者は、あなたが生成した出力に対して一切の権利を主張しません。出力を自由に使用できますが、その使用はライセンスに定められた条件に反しないものでなければならず、その責任はあなたにあります。

3. 重みを再配布できます。ただし、その際はライセンスと同様の使用制限を含め、すべてのユーザーに修正版CreativeML OpenRAIL-Mライセンスのコピーを提供しなければなりません(ライセンス全文を丁寧に読んでください)。

フルライセンスを以下でご確認ください:Stable Diffusion および Dreamlike Diffusion 1.0

RT variant はDreamlike Diffusionライセンスの対象外です)

使用制限

あなたは、モデルまたはその派生モデルを以下の用途に使用しないことに同意します:
- 适用される国家的、連邦的、州、地方、または国際的な法律・規制に違反するいかなる方法でも
- 子供を搾取・害を与える、またはそのような行為を試みる目的で
- 他者を害する目的で、検証可能な偽情報および/またはコンテンツを生成・拡散すること
- 個人を危害する可能性のある個人を特定可能な情報を生成・拡散すること
- 他者を中傷、悪口を言う、またはいじめること
- 個人の法的権利に悪影響を与える、または拘束力のある義務を生成・変更する完全自動化された意思決定に使用すること
- オンラインまたはオフラインの社会的行動、または既知または予測される個人的・性格的特徴に基づいて、個人またはグループを差別または害する目的で使用すること
- 年齢、社会的、身体的、または精神的特徴に基づき特定のグループの脆弱性を悪用して、そのグループの個人の行動を歪め、その個人または他の個人に身体的または心理的害を及ぼす可能性があること
- 法的に保護された特徴またはカテゴリーに基づいて個人またはグループを差別する目的で使用すること
- 医療アドバイスや医療結果の解釈を提供すること
- 司法、法執行、移民、難民手続きの適用のために情報を生成・拡散すること(たとえば、個人が不正や犯罪を犯すと予測するためのテキストプロファイリング、文書内主張の因果関係の抽出、無差別かつ恣意的な使用など)
- NFTを生成すること

利用規約

- このモデルの不適切な使用によって生じるあらゆる法的責任は、利用者自身に帰します。
- これらのモデルのいずれかをマージして使用する場合、その手順を明示し、どの部分に変更を加えたかを明確に示してください。

注意

何か矛盾点や修正が必要な点をご覧になった場合は、お知らせください。

このモデルで生成された画像

画像が見つかりません。