Product Design (minimalism-eddiemauro) LORA
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
使用する前に
Stable Diffusionの仕組みを理解している必要があります。モデルを起動するためのインターフェースとして、Automatic1111の利用をおすすめします。
このモデルはSD 1.5モデルの基盤で学習させたものであり、完璧ではない点を認識してください。安定した生成に至るまで、非常に多くのテストが必要でした。より優れたベースモデル(例:SD XL)が登場した際には、モデルをさらに進化させます。
これはLORAモデルです。チェックポイントの拡張として使用することをおすすめします。リアリズムを重視したデータセットモデルの利用を強く推奨します。
AI画像生成に関する解説も行っているため、Instagramアカウントにフォローしていただけると幸いです:https://www.instagram.com/eddiemauro.design/
紹介
PRODUCT DESIGN (minimalism-eddiemauro) LORA:こんにちは、プロダクトデザインおよび自動車デザイナーです。AIとの試行はとても楽しく、デザインに非常に良いツールだと考えています。このツール(Lora)はデザインプロセス(形状・アイディア生成)に非常に役立ちますが、特に美学的な調整に大きな助けとなります。また、スケッチや3Dコンセプトをレンダリングスタイルに変換することも可能です。基本となるLoraを作成し、さまざまなチェックポイントでテストした結果、「ミニマリズム」の新しいタイプのスタイルが生まれました。このスタイルは、DeliberateやDreamshaperからインスピレーションを得てコントラストを強めつつ、ミニマリズムのスタイルを維持しています。これは、私によるミニマリズムチェックポイントから中心に作成された公式Lora一般モデルです。

ご支援いただけると、より高品質なモデルを追加アップロードできるようになります。ぜひ以下のリンクから寄付をお願いします。大変感謝いたします:https://ko-fi.com/eddiemauro
インストール
良いUIとしてAutomatic1111を使用していますので、ローカルにインストールするか、Colabや別のホスティングサービスでオンラインで利用することをおすすめします。オンラインでのインストール手順や動画も多数あります。ローカル設置の場合は、オンラインでのチュートリアル動画を視聴してください。安定したインターフェースを得るためには、少なくとも6〜8GBのVRAM(NVIDIA)搭載GPUが必要です。「Microsoft Edge」で動作させるようにしてください。「Google Chrome」では問題が発生する可能性があります。また、「medvram」または「lowvram」の設定を「xformers」と併用してインストールすることをおすすめします(オンラインで方法を検索してください)。
これはLORAモデルです。インストール方法についてはこの動画を参照してください。ファイルをダウンロードし、Loraモデルフォルダ内に配置するだけです。LORAファイルの拡張子は「.safetensor」で、チェックポイントよりもサイズが小さく(1GBを超えることも少ない)なります。
使用前にチェックポイントモデルもインストールしてください。リアリズムや3D/レンダリングの視覚化に特化したモデルを選ぶようにしてください。
画像作成の際は、すべての推奨事項を守ってください。守らないと高品質な画像は生成できません。また、現在のAI画像生成は完全ではなく、一貫性に欠けるため、時間と多くの試行を要することを認識してください。
画像生成の推奨事項
最適なチェックポイントモデル: SD 1.5ベースモデル。必須で「Deliberate v2」[/model/4823/deliberate]、**"DreamShaper v7"[/model/4384/dreamshaper]、"A-Zovya Photoreal v1"[/model/57319/a-zovya-photoreal]、"Profantasy v2.2"[/model/52298/profantasy]または"Realistic Vision v4"**[/model/4201/realistic-vision-v20]のいずれかをダウンロード・インストールし、SD UIにロードしてください。
アクティベートトークン/キャプション: プロンプト欄内で最初の単語は必ず 「emauromin」 または 「emauromin style」 と入力してください。これはスタイルを有効化するための必須事項です。入力しないと正しく動作しません。
推奨されるプロンプト: 正のポジティブスペースでは「futuristic, finely detailed, purism, ue 5, a computer rendering, minimalism, octane render, 4k」を、ネガティブスペースでは「(worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), cropped, text, jpeg artifacts, signature, watermark, username, sketch, cartoon, drawing, anime, duplicate, blurry, semi-realistic, out of frame, ugly, deformed」を使用してください。また、例の画像のメタデータを参照して、プロンプトの模倣も可能です。
推奨されるテキストインバージョン/埋め込み・LORAツール: 「EasyNegative」はネガティブプロンプト用に非常に効果的なテキストインバージョンです。使用してください。ここからダウンロードして「embeddings」フォルダに格納してください。また、「Detail Tweaker」も利用すると、画像の細部をさらに削減できます。ここからダウンロード,LORAとしてインストールし、ポジティブプロンプトで「-0.5」の値で使用してください。チェックポイントが細部が多すぎると感じたときのみ使用し、ミニマリズムスタイルが既に含まれている場合は使用しないでください。これにより、オブジェクトの形状が大きく変化する可能性があります。
LORAのウェイト: モデルの強化を継続的に試みています。現時点では、0.7〜1.0の範囲で正常に動作します。値が高くなるほどミニマリズムの強さが増しますが、0.8〜0.9が1よりも効果的になる場合もあります。
VAE: 使用しているチェックポイントによって異なります。一般的には、「vae-ft-mse-840000-ema-pruned」(Stable Diffusion標準)を推奨します。
Clip Skip: 学習時に2を使用していたため、2を使用してください。
ステップ数とCFGスケール: ステップ数は20~40、CFGスケールは6~8が推奨され、理想的な設定はステップ数30、CFG7です。今後のモデルではこの値が変更される可能性があります。
サンプラー: 主に「EulerA」「DPM++SDE Karras」「DPM++2S a」を使用しています。EulerAはシンプルで創造性が高い傾向です。他のサンプラーも試してみてください。
バッチ: txt2imgでは、4以上の値を設定して複数画像生成を試み、結果を確認してください。GPUが十分な場合、「Batch size」を有効にし、同時に4枚の画像を生成できますが、生成時間が長くなります。性能に不安がある場合は、「Batch count」を用いて順次4枚生成しますが、生成時間は長くなります。
画像のアスペクト比: 512x512、768x512、512x768を推奨します。他のサイズも試してみてくださいが、大きな画像はスタイルが損なわれる可能性があるため、生成を控えてください。大きな画像を作成したい場合は、「txt2imgモードのhires.fix」、「img2imgの拡大法」、「Ultimate SD Upscaleスクリプト拡張+ControlNet」、またはGANモデルによるアップスケーリングを利用してください。
大規模画像の生成方法: Stable Diffusionでは4種類の方法があります。オンラインで調べてください。第一の方法「txt2img hires.fix」では、「4x-UltraSharp」アップスケーラーを使用することを推奨します。ここからダウンロードし、「.pth」ファイルのみを取得し、「ESRGAN」フォルダ内に配置してください。hires.fixでは任意の「アップスケール倍率」を設定し、「ノイズ強度」を「0.5〜0.7」に設定してください。第二の方法では、まずtxt2imgで生成した画像を選び、img2imgモードに切り替えて少なくとも「1.5倍」以上にサイズを拡大し、ノイズ強度を「0.3〜0.5」に設定します。第三の方法では、img2imgの設定をそのまま利用し、「ControlNet拡張」の「タイルモード」を有効化するとともに「Ultimate SD Upscale」スクリプトも有効化します。詳細はこちらのチュートリアル動画を参照してください。最後の方法では、txt2imgで生成した画像を「Extras」に送り、GANモデルを選択してスケーリングします。「4x-UltraSharp」モデルも使用可能です。
クリエーションのコントロール強化: 「ControlNet」拡張機能を使用して、希望する形状をより正確に生成できます。スケッチなども試すことができます。"Scribble"(スケッチ)または"Lineart"(線画)モードを利用するとよいです。この機能は導入後、使用方法を学ぶことが大切です。オンラインで多くの動画が提供されています。
画像メタデータ用プロンプトのコピー: 例として使用している画像をこちらからダウンロードし、Automatic1111の「PNG info」タブに貼り付けてください。
例のプロンプト:
ポジティブプロンプト:
emauromin style, futuristic armchair, finely detailed, purism, ue 5, a computer rendering, minimalism, octane render, 4k lora:eddiemauroLora2:0.8ネガティブプロンプト:
EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), cropped, text, jpeg artifacts, signature, watermark, username, sketch, cartoon, drawing, anime, duplicate, blurry, semi-realistic, out of frame, ugly, deformedステップ数: 20〜40(EulerAは20で十分、DPM++SDE KarrasまたはDPM++2S aなら20~40)
CFGスケール: 6〜8(理想は7)
今後の予定
モデルのさらなる高度化を試みています。本モデルは512アスペクトで学習されていますが、次は768(より大きなサイズ)で試みます。また、キャプション変更、ステップ数、エポック数など他の設定も調整していきます。このバージョンのモデルをより良くしたい場合は、ko-fiでの支援を続けていただけると幸いです。支援者が増えることで、より多くの時間をモデルのトレーニング・強化に投資できますが、支援がなければ実現できません。

また、Ko-fi会員レベル1向けに、初めてのプライベートモデル「eddiemauro scene」をリリースしました。これはミニマリズム風景のレンダリング用モデルです。プライベートモデルへのアクセスをご希望の方は、支援・会員登録をお願いします。今後はプロダクトや自動車デザインを中心としたモデルも追加していきます。
ライセンス
Stable Diffusionのライセンスについてこちらをご確認ください。本モデルに関しては、画像生成用途(商用含む、生成した画像の販売も可)で自由に使用可能です。以下は禁止事項です:
- 私の許可なく、あらゆるサーバーやオンライン公開サイトにこのモデルをアップロードすること。
- 私の許可なく、このモデルを直接共有・配布する行為(異なる名前で改変あるいは、このモデルを他の人間が有料画像生成サービスで使用する)。
- 他のチェックポイントやLoraとマージして出版・公開・オンライン共有すること。その際は事前に私に相談してください。
- 本モデルまたは本モデルをもとにしたマージモデルを販売すること。
支援について
私のソーシャルネットワークにフォローしていただけると、制作プロセスやデザインのコツ・ツールなどを紹介します。また、Webページもご確認ください。デザインサービスが必要な場合は、フリーランスとして対応いたします。
https://www.facebook.com/eddiemauro.design
https://www.instagram.com/eddiemauro.design













