Product Design (Realistic minimalism-eddiemauro) LORA
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
使用前にお読みください
Stable Diffusionの動作方法を理解している必要があります。モデルの起動には、Automatic1111をインターフェースとして使用することを強くおすすめします。
これはSD 1.5モデルで学習されたモデルであるため、完璧ではないことを認識しておく必要があります。安定した生成に至るまで、何度もテストを重ねてきました。今後より優れたベースモデル(例:SD XL)が登場した際には、モデルの改善も行います。
これはLORAモデルであるため、チェックポイントの拡張として利用するのが推奨されます。リアリスティックなデータセットのモデルの使用をおすすめします。
私のAI画像生成に関する説明やアドバイスを掲載しているインスタグラムアカウントにフォローしてください:https://www.instagram.com/eddiemauro.design/
はじめに
プロダクトデザイン(リアリスティックミニマリズム - eddiemauro)LORA:はじめまして。私はプロダクトデザインと自動車デザインに携わる者ですが、AIと組み合わせてデザインする試みに非常に熱意を持っています。このツールはデザインプロセス(形やアイデアの生成)に非常に有用ですが、何よりも美的な仕上げを大きくサポートしてくれます。また、スケッチや3Dスケッチをレンダリング風に変換することも可能です。私は基本的なLORAを作成し、多数のチェックポイントでテストを行い、独特の「ミニマリズム」のスタイルが生まれました。このスタイルはより暗め(Majic由来)で、ミニアリズムの特徴を維持しつつ、よりリアルな物体の形状を表現するようになっています。そのため、私の他のモデルに比べ、やや「創造的」ではないと感じています。

私の作品を応援し、より高品質なモデルのアップロードを支援したい場合、下記のリンクから寄付をお願いします。とても感謝します:https://ko-fi.com/eddiemauro
インストール手順
Automatic1111(Stable Diffusion画像生成用最良のUI)を使用しています。ローカルにインストールするか、Colabやその他のホスティングサービスを利用してオンラインで使用することをおすすめします。オンラインでインストール手順や動画を確認できます。ローカルインストールをご希望の場合は、こちらのチュートリアル動画を参照してください。安定したインターフェースを得るためには、最低でも6〜8GBのVRAMを搭載したNVIDIAグラフィックカードが必要です。「Microsoft Edge」で使用することを推奨します(Google Chromeでは問題が発生する可能性があります)。また、「medvram」または「lowvram」オプションも併用してインストールし、「xformers」の設定も確認してください(ネットで設定方法を検索してください)。
これはLORAモデルです。インストール方法については、こちらの動画をご覧ください。ファイルをダウンロードしてLORAモデルフォルダに配置するだけです。LORAファイルの拡張子は「.safetensor」であり、チェックポイントよりサイズが小さく、通常1GBを上回ることはありません。
チェックポイントモデルを併用する必要があります。リアリスティックな視覚表現や3D/レンダリングに特化したモデルを選択してください。
画像作成には、すべての推奨事項を守ってください。守らないと、良好な画像品質を得ることは不可能です。また、現時点のAI画像生成は一定ではなく完璧ではないため、時間をかけて試行錯誤を重ねる必要があります。
画像生成の推奨事項
最も推奨されるチェックポイントモデル:SD 1.5ベースのモデル。必須となります。以下のモデルを使用してください:
"majicMIX realistic (v4)"、
"majicMIX Lux v1 (v2)"、
"XXMix_9realistic v2.5 (test v3)"(時折ぼやけ効果を発生させる可能性あり)、
"A-Zovya RPG v3" (環境がシンプル)、
"Rev Animated v.1.2.2" (よりカラフルなスタイルを提供)。
これらを先にダウンロードし、SD UIに読み込むようにしてください。最新版の使用もおすすめします。アクティベーショントークン/キャプション:プロンプト欄の最初の単語は必ず “emauromin” または “emauromin style” と入力してください。これがないとスタイルが正しく適用されません。
その他の推奨プロンプト:
ポジティブ空間:「futuristic, finely detailed, purism, ue 5, a computer rendering, minimalism, octane render, 4k」
ネガティブ空間:"(worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), cropped, text, jpeg artifacts, signature, watermark, username, sketch, cartoon, drawing, anime, duplicate, blurry, semi-realistic, out of frame, ugly, deformed"
例の画像のメタデータを確認し、プロンプトを模倣してみることもおすすめします。推奨テキストインバージョン/埋め込みモデルかLORAツール:ネガティブプロンプトに「EasyNegative」を使用することを強くおすすめします。ここからダウンロードし、「embeddings」フォルダに配置してください。さらに、「Detail Tweaker」も推奨します。これは画像の細部をさらに減らすのに役立ちます。ここからダウンロードし、LORAとしてインストール。ポジティブプロンプトに「-0.5」という値で使用します。チェックポイントが細部が多いと感じたら使用し、ミニマリズムのスタイルがどうにもならない場合に使用しないでください。このツールは物体の形状を大きく変える可能性があります。
LORA重み:私はモデルの改善を試みています。現時点では、0.7~1.0の範囲で良好に動作しています。重みが高くなるほど、ミニマリズムの効果が強くなります。まれに、0.8~0.9の値が1.0より適している場合もあります。
VAE:使用するチェックポイントに応じて異なります。一般的には、標準的なStable Diffusionの「vae-ft-mse-840000-ema-pruned」を推奨します。
Clip Skip:このモデルは2で学習されているため、Clip Skipに2を設定してください。
ステップ数とCFGスケール:ステップ数は「20~40」、CFGスケールは「6~8」を推奨します。理想はステップ30、CFG7です。今後のモデルではこれらの数値が変更される可能性があります。
サンプラー:主に「EulerA」、「DPM++SDE Karras」、「DPM++2S a」を使用しています。Eulerはシンプルで創作性が高い傾向です。他のサンプラーも試してみてください。
バッチ:txt2imgでは、1枚以上生成するため「4」を設定してください。ゲーミングGPUをお持ちの場合は「バッチサイズ」を使用すると同時生成で4枚作成できます(生成時間が長くなる)。お使いのPCが耐えられない場合は、「バッチカウント」に切り替えて、順次4枚生成します(同時に生成されない)。
画像のアスペクト比:512x512、768x512、512x768をおすすめしますが、他のサイズも試してみてください。拡大画像を生成するとスタイルが失われる可能性があるため、大きいサイズは避けてください。「hires.fix」や「img2img増幅法」、「Ultimate SD Upscaleスクリプト拡張+ControlNet」、またはGANモデルによるアップスケーリングで対処してください。
大きな画像の作成方法:Stable Diffusionでは、大きく画像を作成する4通りの方法があります。オンラインで詳細を確認可能です。
1. txt2img hires.fix:強化モデル「4x-UltraSharp」を使用してください。こちらからダウンロードし、「.pth」ファイルのみをダウンロード、その後「ESRGAN」フォルダに配置。hires.fixでは任意の「アップスケール比率(upscale by)」を設定し、「ノイズ除去強度(denoise strength)」を「0.5~0.7」に設定してください。
2. img2img:txt2imgで生成した画像を選択し、img2imgモードに切り替え、サイズを最低1.5倍に拡大し、「ノイズ除去強度」を「0.3~0.5」に設定。
3. ControlNet + Ultimate SD Upscale:img2imgと同じ設定で、「ControlNet」拡張の「タイルモード」を有効化し、「Ultimate SD Upscale」スクリプトも使用。詳細はこちらのチュートリアル動画を参考に。
4. Extras:txt2imgで生成した画像を「Extras」に送り、GANモデルを選択して拡大します。ここでも「4x-UltraSharp」モデルを利用できます。創造の制御強化:「ControlNet」拡張を使って、希望する形状をより精密に制御できます。スケッチでも試すことも可能です。「Scribble」や「Lineart」モードを使用してください。この拡張のインストールと使い方については、オンラインで多くの動画が公開されています。
プロンプトのコピー(画像メタデータ用):私のサンプル画像をこちらからダウンロードし、Automatic1111の「PNG info」タブに貼り付けてください。
サンプルプロンプト:
ポジティブプロンプト:
emauromin style, futuristic armchair, finely detailed, purism, ue 5, a computer rendering, minimalism, octane render, 4k lora:eddiemauroLora2:0.8ネガティブプロンプト:
EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), cropped, text, jpeg artifacts, signature, watermark, username, sketch, cartoon, drawing, anime, duplicate, blurry, semi-realistic, out of frame, ugly, deformedステップ数:20~40(EulerAなら20で十分、DPM++SDE KarrasやDPM++2S aは40推奨)
CFGスケール:6~8(理想は7)
今後の予定
私はすでにこのモデルの改善を進めています。現在のモデルは512x512のアスペクトで学習されていますが、768(より大きなサイズ)やその他の設定(キャプション、ステップ数、エポック数など)でも試作を進めます。より良いバージョンのモデルを希望する場合は、ko-fiで支援をお願いします。より多くの支援があれば、より多くの時間を注いでモデルのトレーニングと改善が行えますが、現状では不可能です。

私はmy Ko-fiのLv.1メンバーシップに対して初のプライベートモデル「eddiemauro scene」をリリースしました。これはレンダリング用のミニマリスティックな景色を作成するモデルです。プライベートモデルにアクセスしたい場合は、私の支援とメンバーシップの契約をお願いします。また、今後はプロダクトデザインや自動車デザインに特化したモデルも追加でアップロードする予定です。
ライセンス
Stable Diffusionのライセンス詳細はこちらをご覧ください。このモデルに関しては、画像生成においていかなる用途でも使用可能です(商用利用も可)。以下の行為は厳禁です:
- 私の許可なしに、このモデルをサーバーまたは公開オンラインサイトにアップロードすること。
- 私の許可なしに、このモデルをオンラインで共有すること。特に、名前を変えて別のモデルとみなす、または商用画像生成サービスで実行することを禁止。
- このモデルをチェックポイントやLORAとマージして、発表または共有すること。事前に私に相談してください。
- このモデルまたはこのモデルを用いたマージモデルを販売すること。
支援について
私のSNSアカウントをフォローしてください。制作プロセスやデザインのヒント・ツールを随時公開します。また、Webページを確認し、デザインサービスをご利用になりたい場合はフリーランスとして対応できます。
https://www.facebook.com/eddiemauro.design
https://www.instagram.com/eddiemauro.design














