Fresh Photo (realism eddiemauro-mix)

詳細

ファイルをダウンロード

モデル説明

使用前に

  • Stable Diffusionの動作方法を理解する必要があります。モデルを起動するインターフェースとして、Automatic1111の使用をおすすめします。

  • これはSD 1.5モデルを基盤としたモデルであり、完璧ではない点に注意が必要です。安定した生成に至るまで、何度もテストを繰り返しました。より優れたベースモデル(例:新しいSD XL)が登場したら、モデルをさらに強化する予定です。

  • これはチェックポイントデータセットです。

  • マージモデルであるため、たまにNSFW画像を生成する可能性があります。ネガティブプロンプトに「nudes」を追加してください。

  • 私のInstagramアカウントでAI画像生成に関する解説を配信しています。フォローしていただけると嬉しいです:https://www.instagram.com/eddiemauro.design/

紹介

FRESH PHOTO(リアリズム eddiemauro-mix)チェックポイント:はじめまして。私は製品デザインと自動車デザインをしており、AIとの実験にとてもワクワクしています。デザインのツールとして非常に良いと考えています。

v1: リアルなモデルを統合した製品。さまざまな写真スタイルで良好な性能を発揮します。リアリスティックな画像生成のための「汎用モデル」を作りたいという思いから開発しました。

v1.5: プロンプトの改善と一貫性向上。彩度がより鮮やかになりました。人種の多様性も向上。ディテールもより精巧に。

v2.0: ディテール、リアルさ、解像度がさらに向上。形状の一貫性が改善。ウォームフィルターの影響はやや低め。人種の多様性表現がさらに強化。全体的にv1.5より優れているが、一部の特定の表現ではv1.5の方が優れている場合もあります。

v2.5(+インペイント対応): v2を上回る性能。

v2.5 LCM: v2全体より優れている。v2.5ノーマルより暗めでディテールも豊か。Euler-a NormalまたはLCM Normalと組み合わせて使用可。CFG 1〜2、ステップ数 5〜20。注:ここでの画像サンプルはCFG1.5で生成しており、Civitaiのメタデータは正確ではありません。

私の作品を応援し、より高品質なモデルを多数アップロードできるように支援していただける場合は、こちらから寄付をお願いします:https://ko-fi.com/eddiemauro

インストール

  • Automatic1111を使用しており、Stable Diffusion画像生成における最良のUIです。ローカルにインストールするか、Colabなどのホスティングサービスでオンライン利用をおすすめします。インストール方法のオンラインガイドや動画も多数あります。ローカルインストールをご希望の場合は、こちらのチュートリアルをご覧ください。安定したインターフェースを確保し、「Microsoft Edge」で起動することをおすすめします(「Google Chrome」では問題が生じる可能性があります)。また、「medvram」「lowvram」オプションと「xformers」も併用して導入してください(詳細はオンライン検索で)。

  • 本チェックポイントモデルをインストールする必要があります。

  • 画像生成に際して、私のすべての推奨事項を守ってください。守らなければ優れた画像品質を得ることは不可能です。また、AI画像生成は現在まだ一貫性や完璧さに欠ける点も考慮してください。実現のためには時間と多数の試行が必要です。

画像生成の推奨事項

  • Activation token / キャプション: プロンプトの最初に 「RAW photo of」 または 「Analog photo of」 を入れ、画像にリアリズムを加えることができますが、必須ではありません。

  • プロンプト推奨事項: プロンプト内では以下のキーワードを使用することで、生成品質が向上します。
     ・ポジティブスペース:「Photorealistic, Hyperrealistic, Hyperdetailed, detailed skin, soft lighting, subsurface scattering, realistic, masterpiece, best quality, ultra realistic, 8k, Intricate, High Detail, film photography, soft focus」
     ・ネガティブスペース:「((nsfw)), ((asian)), Japanese, Korean, Chinese, ((disfigured)), ((deformed)), ((extra limbs)), (((duplicate))), ((morbid)), ((mutilated)), out of frame, extra fingers, mutated hands, poorly drawn eyes, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), cloned face, body out of frame, out of frame, bad anatomy, gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), (fused fingers), (too many fingers), (((long neck))), tiling, mutated, cross-eye, canvas frame, frame, cartoon, 3d, weird colors, blurry, cgi, 3d, render, sketch, cartoon, drawing, anime, cropped」
     例画像のメタデータを確認し、プロンプトを模倣することも可能です。人種グループを再現する際は、このウェブページで人種グループを指定し、名前(姓・名)1組をコピーする方法がおすすめです。

  • プロンプト推奨事項(v2.5): 簡潔に。単に「RAW photo of」、「Photo of」、または「Analog photo of」だけで十分です。
     ・ポジティブスペース:単に上記のキーワード。
     ・ネガティブスペース:「nudes, asian, worst quality, normal quality, bad quallity, text, artifacts, bad eyes, strabismus, deformed, cartoon, render」
     生成される人物の多くがアジア系ですが、これを回避したい場合はネガティブプロンプトに「asian」を追加してください。

  • テキストインバージョン / エンベッティングまたはLoRA推奨:EasyNegative」はネガティブプロンプト用として最も優れたテキストインバージョンの一つです。ぜひ使用してください。こちらからダウンロードし、「embeddings」フォルダに配置してください。また、「Detail Tweaker」LoRAも使用すると、画像のディテールをさらに強化できます。こちらからダウンロードし、LoRAとしてインストール後、ポジティブプロンプト内で「1」の値で利用してください。チェックポイントに極めて豊かなディテールがある場合にのみ使用するように。ただし、ミニマルなスタイルの生成時には使わないでください。また、「Detail Tweaker」はimg2imgモードでのみ使用可能で、バッチ生成後に適用してください。他にも、コントラストを向上させる「Epi noiseoffset」なども併用可能です。

  • テキストインバージョン / エンベッティングまたはLoRA推奨(v2.5): 簡潔に。エンベッディングや複雑な言葉を使用する必要はありません。ディテールが必要な場合のみ、「Detail Tweaker」LoRAのみを使用してください。

  • VAE: 基本的に「vae-ft-mse-840000-ema-pruned」(Stable Diffusion標準)が推奨されます。v1.5とv2ではVAEが焼き込まれています。フォトスタイルにはわずかな暖色(黄色)のトーンと、やや色調のデサチュレーションが特徴です。v1.5ではVAE焼き込みの影響により、色がややより鮮やかになります。

  • Clip Skip: リアリズムを重視する場合は1を。実験用に2を使用。

  • ステップ数とCFG: ステップ数は「30〜50」、CFGスケールは「6〜8」を推奨。理想はステップ30、CFG7。次期モデルではこれらの値が変更される可能性があります。時々、CFG9+ステップ40〜50が良い結果を出す場合もあります。10以上で高ステップ数を使うと失敗傾向が高まります。v2.5の場合:ステップ30、CFG6。LCM:Euler-a NormalまたはLCM normalで使用可。CFG 1〜2、ステップ数 5〜20。

  • サンプラー: 主に「DPM++SDE Karras」を使用。Eulerはシンプルですが、ディテールがやや不足します。好みに応じて他のサンプラーも試してみてください。

  • バッチ処理: txt2imgでは4を値として設定し、複数画像を生成・比較してください。グラフィックカードの性能が高ければ「Batch size」を使用すると同時に4枚の画像を生成できます(生成時間は延びます)。ただし、システムに負荷がかかる場合は「Batch count」に切り替えて、順次4枚生成するようにしてください(実行時間は長くなります)。

  • 画像のアスペクト比: 512×512、768×512、512×768を推奨。他にもさまざまなサイズで試すことができますが、大きなサイズの画像生成はスタイルが失われる可能性があるため、推奨しません。大きな画像を生成したい場合は、txt2imgモードでhires.fix、img2imgの拡大法、またはUltimate SD Upscaleスクリプト拡張+ControlNet、あるいはGANモデルによるアップスケーリングを利用してください。

  • 大きな画像を作成する方法: Stable Diffusionでは大きく4通りの方法があります。オンラインで詳しい手順を確認できます。
     1. txt2img hires.fix:アップスケーリングモデルとして「4x-UltraSharp」を推奨。ダウンロードはこちら(".pth"ファイルのみ)を利用して、「ESRGAN」フォルダ内に配置。hires.fixでは「upscaling by」を任意設定し、「denoise strength」を「0.5〜0.7」に。
     2. img2img モード拡大:txt2imgで生成された画像を選択し、img2imgモードに切り替え、サイズを1.5倍以上に拡大。denoise strength 0.3〜0.5。
     3. ControlNet+Ultimate SD Upscale:img2imgで同様の設定を活用。ControlNet拡張の「tile」モードと「Ultimate SD Upscale」スクリプトを併用します。詳細はこちらのチュートリアルをご覧ください。
     4. ExtratからGANモデルによる拡大:txt2imgで生成された画像を「extras」に送信し、GANモデルを選択して拡大。また「4x-UltraSharp」「4xNMKD-SIAX_200k」「4xUniscaleV2-Moderate」なども利用可能。v2.5の場合は「8x-NMKD-Superscale_150000_G」モデルを使用してください

  • 生成のコントロール強化: 「ControlNet」拡張を使用すると、生成する形状をより細かく制御できます。スケッチでのテストも可能。ScribbleやLineartモードを活用。拡張の導入と使い方を学ぶことをおすすめします。オンラインには多数の動画があります。

  • プロンプトをメタデータにコピー: 例の画像を本ページからダウンロードし、Automatic1111の「PNG info」タブに貼り付けてください。

例のプロンプト:

ポジティブプロンプト:
RAW photo of Gotzon Otxoa in casual clothes, little smile, small details, photorealistic, ultra-realistic photo, 8k uhd, dslr, soft lighting, high quality, film grain, Fujifilm XT3, (masterpiece) lora:add_detail:1

ポジティブプロンプト v1.5-2:
RAW photo of Muirgheal MacCarrick with sweater, red hair, Photorealistic, Hyperrealistic, Hyperdetailed, detailed skin, soft lighting, subsurface scattering, realistic, masterpiece, best quality, ultra realistic, 8k, Intricate, High Detail, film photography, soft focus

ネガティブプロンプト(シンプル):
EasyNegative, ((nsfw)), ((asian)), Japanese, Korean, Chinese.

ネガティブプロンプト(完全版):
((nsfw)), ((asian)), Japanese, Korean, Chinese, ((disfigured)), ((deformed)), ((extra limbs)), (((duplicate))), ((morbid)), ((mutilated)), out of frame, extra fingers, mutated hands, poorly drawn eyes, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), cloned face, body out of frame, out of frame, bad anatomy, gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), (fused fingers), (too many fingers), (((long neck))), tiling, mutated, cross-eye, canvas frame, frame, cartoon, 3d, weird colors, blurry, cgi, 3d, render, sketch, cartoon, drawing, anime, cropped, Easynegative

ステップ数: 30〜50(DPM++SDE Karrasが最適、EulerAで動作することもあるが、ディテールが失われる)

CFGスケール: 7〜9(8が理想)

「((asian)), Japanese, Korean, Chinese」は、アジア系の人種を意図しない場合に削除してください。多くの試行と調整の結果、ネガティブプロンプトでは「EasyNegative」一枚で十分であることが判明しましたが、v1.5〜2.0ではそれ以上に必要とされる場合があります。

例のプロンプト v2:

ポジティブプロンプト:
RAW photo of Isaura Ojeda in casual clothes, little smile, realistic, city streets lora:General-Design\\add_detail:0.7

ネガティブプロンプト(シンプル):
nudes, asian, worst quality, normal quality, bad quallity, text, artifacts, bad eyes, strabismus, deformed, cartoon, render

ステップ数: 30〜50(DPM++SDE Karrasが最適、EulerAでも動作するが、ディテールを失う可能性あり)

CFGスケール: 6〜7。LCM:Euler-a NormalまたはLCM normalと組み合わせて使用可。CFG 1〜2、ステップ数 5〜20。

「asian」は人種を意図しない場合に削除してください(顔生成において)。

今後の展望

すでにモデルの強化を検討しています。今回訓練したモデルは512×512のアスペクト比ですが、768×768(より大きなサイズ)や他の設定(キャプション、ステップ数、エポック数等)で再訓練を試みます。このバージョンのより優れたモデルを求める場合、こちらのKo-fiでの支援をどうかお願いいたします。より多くの人々が支援してくれれば、モデルの訓練・強化にさらなる時間を割けますが、そうでなければその限りではありません。

私の初のプライベートモデル、「eddiemauro scene」として、Ko-fi会員レベル1向けにミニマルな風景生成モデルをリリースしました。プライベートモデルにアクセスしたい場合は、支援・会員登録をお願いします。今後は製品・自動車デザインをテーマにしたモデルも頻繁にアップロードする予定です。

ライセンス

Stable Diffusionのライセンスはこちらを参照してください。本モデルに関しては、実験目的での利用に限定。以下の行為は禁止:

  • 私の許可なく、サーバーまたは公開オンラインサイトへ本モデルをアップロードすること。

  • 私の許可なく、本モデルをオンラインで共有すること。別名にして使用する、もしくは金銭目的の画像生成サービスで本モデルを利用(実行)することは禁止。

  • 本モデルをチェックポイントやLoRAとマージし、公開またはオンライン共有すること。その際は事前に私に相談してください。将来のルールを含む。

  • 本モデルまたはそのマージモデルを販売すること。

支援について

私のSNSをフォローしてください。制作プロセスやデザインのヒント、ツールを紹介します。また、デザイントレードのニーズがある場合は、フリーランスとしてご対応可能です。

http://eddiemauro.design/

https://www.facebook.com/eddiemauro.design

https://www.instagram.com/eddiemauro.design

https://www.linkedin.com/in/eddiemauro

https://www.behance.net/eadesign1

このモデルで生成された画像

画像が見つかりません。