Fresh Magic XL (digital-3D eddiemauro-mix)

詳細

ファイルをダウンロード

モデル説明

使用前

  • Stable Diffusionの動作方法を理解しておく必要があります。モデルを起動するためのインターフェースとして、ComfyUIまたはAutomatic1111の使用を推奨します。CivitaiはComfyUIのメタデータを読み取れませんので、自由に実験していただいて構いません。また、ComfyUIのシステムはAutomatic1111とは異なります(CFG、ステップ、設定)。現在私はAutomatic1111は使っておらず、ここに示す例はすべてComfyUIベースです。メタデータの簡単な翻訳を試みました。

  • これはXLモデルに基づくブロックマージモデルです。望ましい生成結果を得るまで、非常に多くのテストを重ねました。SD1.5システムはSDXLとは大きく異なりますので、両方のバージョンを使用できますが、この違いを考慮してください。

  • これはチェックポイントデータセットであり、LoRAではありません。

  • マージモデルであるため、時折NSFW画像を生成する可能性があります。ネガティブプロンプトに「(nudes:0.1)」または単に「nudes」を追加することを推奨しますが、これですべてが解決するわけではありません。これは単にモデルの訓練結果の一部です。

  • 私のInstagramアカウントをフォローしてください。そこでAI画像生成について解説します:https://www.instagram.com/eddiemauro.design/

紹介

FRESH MAGIC(デジタルと3D-eddiemauroミックス)チェックポイント:こんにちは、私はプロダクトおよびカーデザイナーであり、AIを試すことにとてもワクワクしています。デザインに良いツールだと思うからです。これは私のクリエイションを容易にするために作成したマージモデルであり、SD1.5バージョンも備えています。

v1:ファンタジー、SF、デジタルイラストレーションに適したモデルです。「リアル」または「中程度のリアル」(超リアルではない)な表現(3Dレンダリング)や、フラットなグラフィックスタイルにも対応しています(ただし、このスタイル専用には作成されていません。その場合はFreshDrawバリエーションをご使用ください)。目的は、3D風で「リアル」なアート表現に焦点を当てたデジタルイラストレーション用の「汎用モデル」を作成することでした。これはCivitai上の複数のモデルをブロック方式で組み合わせて作成されました。

v1 Lightning:v1と同様ですが、通常のモデルの方が品質面で優れていると考えています。このモデルは生成が高速で、生成物に多くのディテールを加える傾向があります。このモデルは以下のサンプラーでのみ動作します:DPM++SDE(スケジューラ:SIMPLE)、HEUN(スケジューラ:SIMPLE)。ステップ数は4〜6、CFGは1〜2。

MagicモデルとDrawモデルの違いを比較してください:

https://miro.com/app/board/uXjVKvtvAYY=/?share_link_id=995366256638

私の作業を支援し、より高品質なモデルをアップロードできるように支援したい方は、以下のリンクから寄付をしてください。心より感謝します:https://ko-fi.com/eddiemauro

インストール

  • 私はStable Diffusionの画像生成に最適なUIであるComfyUIを使用しています。ローカルにインストールするか、Colabや他のホスティングサービスを利用してオンラインでご利用ください。オンラインでその方法を説明した手順や動画が多数あります。

  • 使用するにはチェックポイントモデルをインストールする必要があります。ファイルを「Checkpoints」フォルダに配置してください。

  • 画像生成に際してはいくつかの小さな推奨事項に従ってください。ただし、自由に実験して構いません。XLシステムはより精密で興味深い結果をもたらします。

画像生成の推奨設定

  • アクティブ化トークン/キャプション: プロンプトに何を入れても構いません。私は自分が描きたい画像の説明をそのまま使用し、ポジティブプロンプトには「masterpiece」のみを記載しています。よりリアルな表現を望む場合はポジティブプロンプトに「realistic」を追加してください。イラスト、アニメ、カートゥーンなどの他のスタイルを望む場合、それぞれの単語を追加してください。

  • プロンプト実験には「Wildcards」の使用を推奨します。ComfyUIでWildcardsに対応するノードをインストールしてください。これにより、創造性がさらに高まります。

  • テキスト埋め込み(Textual inversion/embedding)またはLoRAツールの推奨: XLシステムに対して、ポジティブまたはネガティブプロンプトに任意のLoRAまたは埋め込みを使用できます。ネガティブプロンプトには、「worst quality, text, artifacts, strabismus」を使用しています。よりリアルな表現を望む場合は、ネガティブプロンプトにその反対の単語を加えてください。

  • VAE: このモデルはVAEが組み込まれており、ほとんどのモデルも同様です。ただし、VAEを別途使用したい場合、標準的なXL VAEで動作します。

  • Clip Skip: 2または1を使用してください。2の場合は画像がより明確になり、コントラストが強調される傾向があります。1の場合は自然なリアルさを生み出し、良好な結果を得られます。

  • ステップ数とCFG: ステップ数は「20-40」、CFGスケールは「4-6」の使用を推奨します。

  • サンプラー: 主に「EulerA - Normal」または「DPM++SDE - Karras」を使用しています。Eulerはシンプルで創造的な結果を生みやすく、DPMはディテールをより豊かにしますが、SDXLでは実際の差はそれほど大きくないこともあります。他のサンプラーも自由に実験してください。Lightning用には、DPM++SDE(スケジューラ:SIMPLE)、HEUN(スケジューラ:SIMPLE) が必須です。ステップ数は4〜6、CFGは1〜2。また、DPM++SDE GPU +scheduler: SIMPLE または DPM++2M SDE +scheduler: SIMPLE も動作します。

  • バッチ: txt2imgでは生成画像を複数枚得るために、値を4に設定してください。十分なグラフィックカードをお持ちの場合は「Batch size」を使用すると同時に4枚の画像を生成できますが、処理時間が増加します。コンピュータが負荷に耐えられない場合は「Batch count」を使用し、4枚の画像を順次(同時にではなく)生成してください。その場合、生成時間は長くなりますが、安定します。

  • 画像アスペクト比: 1024x1024、または768または1024を基準としたアスペクト比(例:768x1152)を使用してください。その後、拡大率を1.5としてください。

  • 大きな画像の作成: Stable Diffusionには大画像を生成する4つの異なる方法があります。オンラインで方法を確認してください。最初の方法「txt2img hires.fix」では、「4x-UltraSharp」 拡大モデルを使用することを推奨します。こちらからダウンロード(.pthファイルのみ)し、「ESRGAN」フォルダに配置してください。hires.fixオプションでは「upscale by」の値を任意に設定し、「denoise strength」は「0.4-0.7」に設定してください。2番目の方法では、txt2imgで生成した画像をimg2imgモードに切り替え、少なくとも「1.5倍」に拡大し、「denoise strength」を「0.4-0.7」に設定してください。3番目の方法では「tiled generation」を使用し、img2imgと同様の設定で「ControlNet」拡張機能または「Ultimate SD Upscale」スクリプトの「tile」モードを有効にしてください。4番目の方法では、txt2imgで生成した画像を「extras」に渡し、GANモデルを選択して拡大します。ここでも「4x-UltraSharp」モデルを使用できます。

  • 生成のより詳細な制御: 望む形状をより正確に制御したい場合、「ControlNet」拡張機能を使用し、スケッチで試すこともできます。「Scribble」または「Lineart」モードを活用してください。この拡張機能をインストールして使い方を学ぶことをおすすめします。オンラインには多数の解説動画があります。

例:プロンプト

ポジティブプロンプト:
戦士の女性のデジタルイラスト、背景に大きな城、シネマティック、masterpiece、カラフル

ネガティブプロンプト:
worst quality, text, artifacts, strabismus

ステップ数: 20-40

CFGスケール: 4-6

今後の展望

私はこのモデルをさらに改善するため、より良いマージを試みています。このバージョンのモデルを気に入っていただけたなら、Ko-fiで支援してください。支援者が増えると、モデルのトレーニングと改善にさらに時間を投資できます。そうでなければ、そのような取り組みは継続できません。

私の初のプライベートモデル「eddiemauro scene」(ミニマリストなシーン生成用)を、Ko-fiメンバーシップlv.1でリリースしました。プライベートモデルにアクセスしたい場合は、支援してこのメンバーシップにご登録ください。今後、プロダクトおよびカーデザインに特化したモデルをさらにアップロードする予定です。

ライセンス

Stable Diffusionのライセンスについてはこちらをご覧ください:https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/blob/main/LICENSE.md
このモデルに関しては、画像生成に関しては自由にご使用いただけますが、以下の行為は禁止されています:

  • 私の許可なく、このモデルをサーバーや公開サイトにアップロードすること。

  • 私の許可なく、このモデルを別の名前でオンラインで共有したり、このモデルをダウンロードして画像生成サービスで収益化すること。

  • このモデルをチェックポイントまたはLoRAとマージして公開・共有すること(事前に私にご相談ください)。

  • このモデルまたはそのマージ版を販売すること。

支援

SNSで私の活動をご覧ください。私の制作プロセスやデザインのヒント、ツールを公開しています。また、私のウェブサイトをご覧いただき、デザインサービスをご希望の場合は、フリーランスとして対応しています。

http://eddiemauro.design/

https://www.facebook.com/eddiemauro.design

https://www.instagram.com/eddiemauro.design

https://www.linkedin.com/in/eddiemauro

https://www.behance.net/eadesign1

このモデルで生成された画像

画像が見つかりません。