Fresh Photo XL (realism eddiemauro-mix)
詳細
ファイルをダウンロード
モデル説明
使用する前にお読みください
Stable Diffusionの仕組みを理解している必要があります。モデルを起動するためのインターフェースとして、ComfyUIまたはAutomatic1111の使用を推奨します。CivitaiはComfyUIのメタデータを読み取ることができないため、自由に実験してください。また、ComfyUIのシステムはAutomatic1111とは異なります(CFG、ステップ、設定)。現在私はAutomatic1111を使用しておらず、以下の例はすべてComfyUIベースです。メタデータを可能なかぎりシンプルに翻訳しました。
これはXLモデルに基づくブロックマージモデルです。望ましい生成結果を得るまで、多くのテストを重ねました。SD1.5システムはSDXLと大きく異なることを理解してください。両方のバージョンを利用できますが、その違いを考慮してください。
これはチェックポイントデータセットであり、LoRAではありません。
マージモデルであるため、時折NSFW画像を生成する可能性があります。必要に応じて、ネガティブプロンプトに「(nudes:0.1)」または単に「nudes」を追加してください。
AI画像生成について解説する私のInstagramアカウントをフォローしてください:https://www.instagram.com/eddiemauro.design/
紹介
FRESH PHOTO(デジタルと3Dのeddiemauroミックス)チェックポイント:こんにちは、私はプロダクトおよび自動車デザイナーで、AIを使った実験に非常にワクワクしています。デザインにこのツールは非常に有効だと考えています。これは、私のクリエイションを容易にするために作成したマージモデルであり、SD1.5版も用意しています。
v1:さまざまな写真スタイルで良好な性能を発揮します。私の目標は、リアリスティックな画像生成に使える「汎用モデル」を作成することです。時折創造的な出力も生み出しますが、より創造的な結果を求める場合は「Fresh Magic」または「Fresh Draw」をご利用ください(ただしリアリズムは失われます)。
v1 Lightning:v1と同様ですが、通常のモデルの品質の方が優れていると考えています。このモデルは生成が高速です。以下のサンプラーでのみ動作します:DPM++SDE + スケジューラ:SIMPLE、HEUN + スケジューラ:SIMPLE。ステップ数:4〜6、CFG:1〜2。
私の作業を支援し、より高品質なモデルをアップロードするための資金を提供したい場合は、こちらから寄付をお願いします。心より感謝いたします:https://ko-fi.com/eddiemauro
インストール
私はStable Diffusion画像生成用の最適なUIであるComfyUIを使用しています。ローカルにインストールするか、Colabや他のホスティングサービスでオンライン利用することを推奨します。その方法については、オンラインの手順や動画を参照してください。
使用するにはチェックポイントモデルをインストールしてください。ファイルを「Checkpoints」フォルダに配置してください。
画像生成の際には、いくつかの小さな推奨事項に従ってください。ただし、自由に実験して構いません。XLシステムはより精密で興味深い結果を生み出します。
画像生成の推奨事項
アクティブトークン/キャプション: プロンプト内では好きな内容を記述できますが、「RAW photo of」、「photo of」、または「Analog photo of」(レトロスタイルを望む場合)で始めるのが良いでしょう。よりリアルな表現を求める場合は、ポジティブプロンプトに「realistic」や「photorealistic」を含めてください。コントラストを強調したい場合は、「dramatic lighting」や「cinematic」などの言葉を追加してください。
プロンプトの実験には「Wildcards」の使用を推奨します。ComfyUIでWildcardsに対応するノードをインストールしてください。これにより、クリエイションにさらに創造性を加えることができます。
テキストual inversion/embeddingまたはLoRAツールの推奨: XLシステムに対して、ポジティブまたはネガティブプロンプトに任意のLoRAまたはEmbeddingを使用できます。ネガティブプロンプトには、「low quality, worst quality, text, artifacts, strabismus, bad eyes, render」を使用しています。リアリズムを減らしたい場合は、ネガティブプロンプトに逆の単語を追加してください。モデルマージの影響でアジア系顔の特徴が出やすい場合があるため、「asian」をネガティブプロンプトに追加することを推奨しますが、実験してご自身で判断してください。NSFW画像が生成される場合は、ネガティブプロンプトに「nudes」または「(nudes:0.1)」を追加してください。
VAE: このモデルにはVAEが内蔵されており、ほとんどのモデルも同様です。ただしVAEを使用したい場合は、標準的なXL VAEで動作します。
Clip Skip: リアリズムを重視する場合は「1」を使用してください。「2」に設定すると、リアリズムがやや低下し、コントラストや色、他の効果が強調されます。これはご自身で実験してください。
ステップとCFG: ステップ数は「30–40」、CFGスケールは「5–6」の使用を推奨します。
サンプラー: 主に「DPM++SDE - Karras」を使用していますが、「DPM++2S A - Normal」(シンプルな仕様)や「DPM++SDE GPU - Karras」でも興味深い結果が出ます。Lightning版ではDPM++SDE + スケジューラ:SIMPLE、HEUN + スケジューラ:SIMPLEでの使用が必須です。ステップ数は4〜6、CFGは1〜2。また、DPM++SDE GPU + スケジューラ:SIMPLEまたはDPM++2M SDE + スケジューラ:SIMPLEでも動作します。
バッチ: txt2imgでは、複数の画像を生成するためにバッチ値を「4」と設定してください。GPUの性能が高い場合は「Batch size」を設定して同時に4枚を生成できます(生成時間は長くなります)。しかし、PCの性能が低い場合は「Batch count」を使用して、4枚を順次生成してください(同時生成ではありませんが、総生成時間は短縮されます)。
画像アスペクト比: 1024x1024、または768または1024を基準としたアスペクト比(例:768x1152)を使用してください。アップスケール時は1.5倍の比率を推奨します。
大きな画像の作成: Stable Diffusionで大画像を生成する方法は4種類あります。オンラインで方法を確認できます。最初の方法「txt2img hires.fix」では、「8x-NMKD-Superscale_150000_G」(https://mega.nz/folder/qZRBmaIY#nIG8KyWFcGNTuMX_XNbJ_g)というアップスケールモデルを使用することを推奨します。ファイルを「.pth」形式でダウンロードし、「ESRGAN」フォルダに配置してください。hires.fixオプションでは、任意の「upscale by」値と「denoise strength」を「0.4–0.7」に設定してください。2番目の方法では、txt2imgで生成した画像をimg2imgモードで再利用し、サイズを少なくとも1.5倍に拡大し、「denoise strength」を「0.4–0.7」に設定してください。3番目の方法は「tiled generation」で、img2imgと同じ設定ですが、「ControlNet」拡張機能または「Ultimate SD Upscale」スクリプトの「tile」モードを有効にしてください。4番目の方法では、txt2imgで生成した画像を「extras」に渡し、GANモデルを選択してアップスケールします。こちらも**「8x-NMKD-Superscale_150000_G」**モデルを使用できます。
作成のより詳細な制御: 「ControlNet」拡張機能を使用して、望む形状をより正確に制御できます。スケッチとの組み合わせも可能です。「Scribble」、「OpenPose」、「Depth」、「Lineart」モードを試してください。この拡張機能のインストールと使い方については、多くのオンライン動画が役立ちます。
例:プロンプト
ポジティブプロンプト:
RAW photo of Laura Ojeda in casual clothes, little smile, Photorealistic, dramatic lighting
ネガティブプロンプト:
low quality, worst quality, text, artifacts, strabismus, bad eyes, render, (asian:0.1)
ステップ数:30–40(Lightning版は4–6)
CFGスケール:5–6(Lightning版は1–2)
今後の展望
私はこのモデルをさらに改良し、より良いマージを試みています。このバージョンの良いモデルをお気に入りなら、Ko-fiで支援してください。支援者が増えるほど、モデルの学習と改良にさらに時間を投資できます。支援がなければ、そのような改善は実現できません。
私は私のKo-fiメンバーシップLv.1向けに、初のプライベートモデル「eddiemauro scene」をリリースしました。これは、レンダリング用のミニマリスティックなシーン生成用モデルです。プライベートモデルにアクセスしたい場合は、支援してこのメンバーシップにご登録ください。今後、プロダクトおよび自動車デザインに特化した追加モデルをここにアップロードする予定です。
ライセンス
Stable Diffusionのライセンスについては、こちらをご覧ください:https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/blob/main/LICENSE.md
この特定のモデルに関しては、画像生成用途に自由にご利用いただけます。ただし、以下の行為は禁止されています:
私の許可なく、このモデルをサーバーや公開オンラインサイトにアップロードすること。
私の許可なく、このモデルを別の名前でオンライン共有したり、このモデルをアップロードして有償画像生成サービスで使用すること。
このモデルをチェックポイントやLoRAとマージして公開・共有すること。事前に必ず私にご相談ください。
このモデルまたはこれを使ったマージモデルを販売すること。
支援について
私のSNSをフォローしてください。作業プロセスやデザインのヒント、ツールを公開しています。また、私のウェブサイトをご覧になり、デザインサービスをご希望の場合、フリーランスとして対応可能です。
https://www.facebook.com/eddiemauro.design
https://www.instagram.com/eddiemauro.design














