Product Design (minimalism-eddiemauro)
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
使用する前に
Stable Diffusionの動作方法を理解しておく必要があります。モデルを起動するためのインターフェースとして、Automatic1111の利用をおすすめします。
これはSD 1.5モデルで訓練されたモデルであるため、完璧ではない点に注意してください。安定した生成を得るまで、多くのテストを重ねました。より優れたベースモデル(例:SD XLの新バージョン)が登場すれば、モデルをさらに改善していきます。
これはチェックポイントデータセットです。
AI画像生成について詳しく説明するため、Instagramアカウントをフォローすることをおすすめします:https://www.instagram.com/eddiemauro.design/
紹介
プロダクトデザイン(ミニマリズム - eddiemauro)チェックポイント:こんにちは、私はプロダクトデザイナー&カーデザイナーですが、AIを使ったデザインの試行に非常に興奮しています。AIはデザインプロセス(形状の生成・アイデア出し)に非常に役立つツールだと思います。また、外観の精緻な調整も大きく支援してくれます。さらに、スケッチや3Dスケッチをレナーディングスタイルに変換することも可能です。
オリジナルモデル: eddiemauro 1.5。ミニマリズムのコンセプトを表現。マット仕上げ。
バリアントモデル: eddiemauro 1.5b。プロンプトがより明確となり、オブジェクトへの適応性が向上していますが、ミニマリズムスタイルは弱まります。オブジェクトの形状はよりリアルに近づいており、オリジナルモデルの方がより「創造的」と感じます。また、マット感は少なくなっています。(別名:eddiemauro3.5)
バリアントモデル v.2: eddiemauro 2。プロンプトがより正確で、オリジナルと初版バリアントよりもオブジェクトへの適応性が向上していますが、ミニマリズムスタイルはさらに薄れています。形状はよりリアルに、オリジナルモデルの方が創造性に富んでいます。hrise.fixやimg2imgモードを使用すると、よりマットな仕上がりになります。彩度は高く、時折奇妙な色の組み合わせが出ることがあります。
バリアントモデル v.2.5: eddiemauro 2.5。プロンプトはより正確で、前バージョンよりもオブジェクトへの適応性が高く、形状の一貫性も非常に優れています。一貫性と創造性のバランスが完璧です。768次元で学習されたため、低ステップ数と低CFGでの動作に優れています。また、前のモデルよりも彩度が低く、色味がわずかに淡くなりますが、CFGを上げることでこれを補完可能です。このモデルをすぐに利用したい場合は、Ko-fiのLv.1会員にご参加ください:

このモデルの開発をサポートし、より高品質なモデルを今後にアップロードできるように、ぜひこちらから寄付をご検討ください。大変感謝いたします:https://ko-fi.com/eddiemauro
インストール
Automatic1111(Stable Diffusion画像生成の最適なUI)を利用しています。ローカルにインストールするか、Colabなどを使ってオンラインで利用することをおすすめします。オンラインでインストール手順や動画を確認できます。ローカルインストールを検討する場合は、こちらのチュートリアルをご覧ください。安定したインターフェースを確保するには、最低でも6~8GBのVRAM(NVIDIA)を推奨します。また、「Microsoft Edge」を使用してください(「Google Chrome」だと問題が発生する可能性があります)。さらに「medvram」または「lowvram」オプションを「xformers」と併用してインストールするとよいです(方法はオンラインで検索してください)。
チェックポイントモデルをインストールする必要があります。
画像生成には、すべての推奨事項を守ってください。守らないと良好な画像品質を得ることはできません。また、現在のAI画像生成は完全ではなく一貫性に欠ける点もあるため、良い結果を得るには時間をかけて多数のテストを行う必要があります。
画像生成の推奨事項
活性化トークン/キャプション: プロンプト欄の先頭に「3D product render」、「product render」、または「3D product render style」と入力する必要があります。これらがスタイルの活性化に必須です。入力しないと正しく動作しません。
推奨されるプロンプト: プロンプト欄で、画像生成を向上させる言葉を以下のように使用してください。
ポジティブ: "futuristic, finely detailed, purism, ue 5, a computer rendering, minimalism, octane render, 4k"
ネガティブ: "(worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), cropped, text, jpeg artifacts, signature, watermark, username, sketch, cartoon, drawing, anime, duplicate, blurry, semi-realistic, out of frame, ugly, deformed"
また、使用例の画像メタデータを確認し、類似したプロンプトを再現できます。テキストインバージョン/エムベッディング、またはLora推奨: 「EasyNegative」はネガティブプロンプト用に最も優れたテキストインバージョンの一つです。使用を推奨します。ここからダウンロードし、「embeddings」フォルダに配置してください。さらに、「Detail Tweaker」も利用すると画像のディテールをさらに抑制できます。こちらからダウンロードし、Loraとしてインストールし、ポジティブプロンプトに「-0.5」の値で使用してください。ただし、チェックポイントが非常にディテールを含んでしまい、ミニマリズムスタイルが失われる場合は使用しないでください。このツールはオブジェクトの形状に大きな影響を与えることがあります。他のLora(例:"Epi noiseoffset" や "Godard Style" )も使用可能ですが、プロダクトデザイン・ミニマリズム向けの私のLoraは使用しないでください。
VAE: 多くの場合、「vae-ft-mse-840000-ema-pruned」が標準的なStable Diffusion VAEmodelとして推奨されます。
Clip Skip: 2で訓練されているため、2を使用してください。
ステップ数とCFG: ステップ数は20~40、CFGスケールは6~9が推奨です。理想的な設定はステップ30、CFG8です。今後のモデルではこの値が変更される可能性があります。
色の調整: 画像に不要な色が出た場合は、ネガティブプロンプトに「weird colors」や避けたい色名を追加してください。v.2は特に彩度が高くなる傾向があります。
サンプラー: 「EulerA」、「DPM++SDE Karras」、「DPM++2S a」を主に使用しています。EulerAはシンプルで創造性に富んでいます。好みに応じて他のサンプラーも試してみてください。
バッチ: txt2imgでは、複数の画像を生成するためにバッチ値を4に設定し、生成結果を確認してください。グラフィックカードに余裕がある場合は「バッチサイズ」を使用(同時に4画像を生成、生成時間は増加)。ただし、処理に負荷がかかりすぎる場合は「バッチ数」に切り替え、順次4画像を生成する(時間は長くなります)。
画像のアスペクト比: 512x512、768x512、512x768 を推奨しますが、他のサイズも試すことができます。大きな画像を生成するとスタイルが失われるため、サイズを大きくしたい場合は、txt2imgモードの「hires.fix」、img2imgのアップスケール方法、Ultimate SD Upscaleスクリプト拡張 + ControlNet、またはGANモデルでのアップスケールを使用してください。
大画像の生成: Stable Diffusionでは大画像生成の方法が4つ存在します(オンラインで方法を確認できます)。
1. 「txt2img hires.fix」方法では、「4x-UltraSharp」アップスケーラーを使用することを推奨します。ダウンロードはこちらから「.pth」ファイルのみを入手し、「ESRGAN」フォルダに配置してください。hires.fixオプションでは「アップスケール倍率」を任意に設定し、「ノイズ強度」を「0.5~0.7」に設定してください。
2. 2番目の方法では、まずtxt2imgで生成された画像を選択し、img2imgモードに切り替え、サイズを少なくとも1.5倍に増幅し、「ノイズ強度」を「0.3~0.5」に設定します。
3. 3番目の方法では、img2imgの設定をそのまま使用し、「ControlNet」拡張の「タイルモード」を有効化し、「Ultimate SD Upscale」スクリプトも使用します。詳しくはこちらの動画チュートリアルをご覧ください。
4. 最後の方法では、txt2imgで生成した画像を「エクストラ」に送り、GANモデルを選択して拡大します。この際、「4x-UltraSharp」モデルも併用可能です。作成物の制御力を高める: 「ControlNet」拡張を使って、望む形状をより正確に制御できます。スケッチとの組み合わせも試せます。「Scribble」や「Lineart」モードをご活用ください。拡張の導入と使い方の習得をおすすめします。オンラインには多数のチュートリアル動画があります。
プロンプトのコピー(画像メタデータ用): 例題画像をこちらからダウンロードし、Automatic1111の「PNG info」タブに貼り付けてください。
例題プロンプト:
ポジティブプロンプト:
3D product render, futuristic armchair, finely detailed, purism, ue 5, a computer rendering, minimalism, octane render, 4k
ネガティブプロンプト:
EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), cropped, text, jpeg artifacts, signature, watermark, username, sketch, cartoon, drawing, anime, duplicate, blurry, semi-realistic, out of frame, ugly, deformed
ステップ数: 20~40(EulerAは20で十分、DPM++SDE KarrasやDPM++2S aは同等)
CFGスケール: 6~9(理想は8)
将来について
既にモデルの改良を進めています。このモデルは512のアスペクト比で学習されていますが、768(より大きい)での再学習を試み、さらに別の設定(キャプション、ステップ、エポック等)も検討中です。このバージョンのより優れたモデルを希望される場合は、Ko-fiで支援を続けることをおすすめします。支援者が増えると、より多くの時間をかけてモデルの訓練・改善が行えるようになりますが、支援がない場合はそれも困難です。

Ko-fiのLv.1会員専用モデル「eddiemauro scene」(ミニマリズム風のシーン生成)をリリースしました。専用モデルにアクセスしたい場合は、支援と共にこの会員にご加入ください。今後もプロダクトデザイン・カーデザイン中心のモデルを追加していきます。
ライセンス
Stable Diffusionのライセンスはこちらで確認してください。このモデルについては、画像生成の目的であれば一切自由に利用可能(商業目的での画像販売も可)ですが、次のような行為は禁止されています:
承認なしにこのモデルをサーバーや公開オンラインサイトにアップロードすること。
承認なしにこのモデルを改名してオンラインで共有する、または、このモデルを他人が運用する画像生成サービスに配布して収益を得ること。
他のチェックポイントまたはLoraとマージして公開・共有すること。その際は必ず事前に相談してください。
このモデルやそのマージ版を販売すること。
支援のお願い
私のSNSをフォローしてください。制作プロセスやデザインのコツ、ツール紹介を共有していきます。また、ウェブページもご確認ください。必要であれば、フリーランスとしてデザインサービスも提供しています。
https://www.facebook.com/eddiemauro.design
https://www.instagram.com/eddiemauro.design












