Product Design (Elegant minimalism-eddiemauro) LORA

詳細

ファイルをダウンロード

モデル説明

使用前に

  • Stable Diffusionの仕組みを理解している必要があります。モデルの起動に際して、Automatic1111をインターフェースとして使用することを強くおすすめします。

  • 本モデルはSD 1.5に基づいて学習されていますので、完全ではない点に注意してください。安定した生成に至るまでに何度も試行錯誤を重ねました。今後、より優れたベースモデル(例:SD XL)が登場すれば、モデルの強化を進めます。

  • これはLORAモデルです。チェックポイントの拡張として使用することをおすすめします。リアリズムを重視したデータセットモデルの使用を強く推奨します。

  • AI画像生成に関する解説をInstagramで行っているため、ぜひフォローしてください:https://www.instagram.com/eddiemauro.design/

はじめに

プロダクトデザイン(エレガントミニマリズム - eddiemauro)LORA:こんにちは、私はプロダクトおよび自動車デザイナーで、AIとの試行に非常に興奮しています。AIはデザインに非常に有効なツールだと信じています。このツール(LORA)はデザインプロセス(形状・アイデアの生成)において非常に役立ちますが、特に美学的な洗練を高める点で大きな効果があります。また、スケッチや3Dスケッチをレンダリング風に変換することも可能です。私は基本的なLORAを作成し、多数のチェックポイントでテストを行いました。その結果、新たな種類の「ミニマリズム」が得られました。これは四川由来の洗練された洗練と攻撃的な質感を融合させたスタイルですが、ミニマリズムの本質を保持しています。さらに、色調は暗く、不透明になりがちです。

私の作業を支援し、より高品質なモデルをアップロードできるようにするには、以下より寄付をお願いいたします。大変感謝します:https://ko-fi.com/eddiemauro

インストール方法

  • 自分で使うのに最適なインターフェースとしてAutomatic1111を推奨しています。ローカルにインストールするか、Google Colabなどのオンライン環境を利用することをおすすめします。オンラインの手順や動画教程も多数あります。ローカルインストールをご希望の場合、こちらのチュートリアル動画を参照してください。なお、安定したインターフェースを確保するには、最低でも6~8GBのVRAM(NVIDIA製)のグラフィックカードが必要です。「Microsoft Edge」で実行することをおすすめします。Google Chromeでは問題が発生する可能性があります。また、「medvram」や「lowvram」の設定も「xformers」と併用して導入することをお勧めします(オンラインで設定方法を検索してください)。

  • これはLORAモデルです。こちらの動画でインストール方法を確認できます。単にファイルをダウンロードし、LORAフォルダに配置するだけです。LORAファイルの拡張子は「.safetensor」であり、多数のチェックポイントほどサイズが大きくありません(1GB以上になるチェックポイントも多いです)。

  • 本モデルを使用するには、リアルな視覚描写や3D/レンダリングをテーマにしたチェックポイントモデルを別途インストールする必要があります。

  • 画像生成を行う際は、私のすべての推奨事項に従ってください。それらを無視すると、良好な品質の画像を生成することはできません。また、現在のAI画像生成技術は完全ではなく、一貫性に欠けている点に注意してください。よい結果を得るには、時間を費やし、多数の試行が必要です。

画像生成の推奨事項

  • 最適なチェックポイントモデル:SD 1.5ベースのモデル。必ず「Szechuan Special Sauce RC003」または「Experience v8」のチェックポイントを使用してください。/model/57931/szechuan-special-sauce?modelVersionId=62378 または /model/5952?modelVersionId=32718 からダウンロード、インストールし、SD UIにロードしてください。

  • アクティベーショントークン/プロンプト:パラメータ欄で、最初の単語として必ず 「emauromin」 または 「emauromin style」 を入力してください。この入力が必須です。これを行わないと、正常にスタイルが反映されません。

  • 推奨プロンプト設定:プロンプトのポジティブ側には、「futuristic, finely detailed, purism, ue 5, a computer rendering, minimalism, octane render, 4k」と入力してください。ネガティブ側には、「(worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), cropped, text, jpeg artifacts, signature, watermark, username, sketch, cartoon, drawing, anime, duplicate, blurry, semi-realistic, out of frame, ugly, deformed」と入力してください。また、サンプル画像のメタデータを確認し、同じプロンプトをシミュレートしてみてください。

  • テキストインバージョン/エンベッディングまたはLORAツールの推奨:ネガティブプロンプト用として、「EasyNegative」が非常に有効なテキストインバージョンであると考えます。これを使用することをお勧めします。こちらからダウンロードし、「embeddings」フォルダに配置してください。さらに、「Detail Tweaker」を、詳細をさらに削減したい場合に使用してください。こちらからダウンロードし、LORAとしてインストールし、ポジティブプロンプトに「-0.5」と入力して使用します。チェックポイントモデルが細部が多すぎる場合は適用し、ミニマリズムの雰囲気が既に表現されている場合は適用しないようにしてください。このツールは物体の形状に大きな変化をもたらす可能性があります。

  • LORAのウェイト:モデルの強化を試みています。現在のところ、0.7〜1の範囲で良好に動作します。値を大きくすると、ミニマリズムの強調度が高まります。中には0.8〜0.9の方が、1.0よりうまく機能する場合もあります。

  • VAE:使用しているチェックポイントによって異なります。一般的には「vae-ft-mse-840000-ema-pruned」を標準で使用することをお勧めします。

  • Clip Skip:本モデルは2で訓練されているため、2を使用してください。

  • ステップ数とCFGスケール:ステップ数は20〜40、CFGスケールは6〜8が推奨です。最適な値は「ステップ30、CFG7」です。今後のモデルではこれらの値が変更される可能性があります。

  • サンプラー:主に「EulerA」、「DPM++SDE Karras」、「DPM++2S a」を使用しています。EulerAはシンプルでクリエイティブな出力をもたらします。他のサンプラーでも実験してみてください。

  • バッチ処理:txt2imgで4を設定すると、複数の画像を同時に生成し、出力の違いを観察できます。グラフィックカードが十分に強力な場合は「バッチサイズ」を使用して同時に4枚を生成可能ですが、生成時間が長くなります。性能に不安がある場合は、「バッチ数」に切り替えて、連続的に4枚を生成するよう設定してください(一括生成ではなく)。使用目的是により生成時間が長くなります。

  • 画像のアスペクト比:512×512、768×512、512×768のサイズを推奨しますが、異なるサイズでも試してみてください。大きな画像を生成するとスタイルが失われる可能性があるため、サイズを大きくしたい場合は、txt2imgモードの「hires.fix」、img2imgの拡大方法、Ultimate SD Upscaleスクリプト+ControlNet、またはGANモデルによるアップスケーリングを使用してください。

  • 大きな画像の生成方法:Stable Diffusionでは大きく画像を生成するための4種類の方法があります。オンラインで調査可能です。第1の方法「txt2img hires.fix」では、アップスケーリングモデル「4x-UltraSharp」を推奨します。こちらからダウンロードし、「.pth」ファイルのみを取得し、「ESRGAN」フォルダに配置してください。hires.fixで「アップスケール倍率」に任意値を指定し、「ノイズ強度」を「0.5〜0.7」に設定してください。第2の方法では、txt2imgで生成した画像をimg2imgモードに読み込み、サイズを最低でも「1.5倍」以上に拡大し、「ノイズ強度」は「0.3〜0.5」に設定します。第3の方法では、img2imgと同じ設定を使用しますが、「ControlNet」拡張機能の「タイルモード」を有効化し、「Ultimate SD Upscale」スクリプトも使用します。ただし、この方法についてはこちらのチュートリアルを参照してください。第4の方法では、txt2imgで生成した画像を「エクストラ」に移動し、GANモデルで拡大します。この際、「4x-UltraSharp」モデルも使用可能です。

  • 生成物の制御強化:生成物の形状をより細かく制御したい場合は、「ControlNet」拡張機能を使用してください。スケッチを利用したテストも可能です。『スクリブル』や『ラインアート』モードを用いると効果的です。この拡張機能をインストールし、使い方を学ぶことをおすすめします。オンラインで多数のチュートリアル動画があります。

  • プロンプトのコピー(画像メタデータ):私のサンプル画像はここからダウンロード可能で、Automatic1111の「PNG info」タブに貼り付けることができます。

サンプルプロンプト:

  • ポジティブプロンプト
    emauromin style, futuristic armchair, finely detailed, purism, ue 5, a computer rendering, minimalism, octane render, 4k lora:eddiemauroLora2:0.8

  • ネガティブプロンプト
    EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), cropped, text, jpeg artifacts, signature, watermark, username, sketch, cartoon, drawing, anime, duplicate, blurry, semi-realistic, out of frame, ugly, deformed

  • ステップ数:20〜40(EulerAなら20で十分、DPM++SDE KarrasやDPM++2S aなら20〜40)

  • CFGスケール:6〜8(理想は7)

今後の予定

すでにモデルの強化を試みています。現在のモデルは512×512の画像アスペクトで学習されていますが、今後は768×768(より大きなサイズ)や、キャプション・ステップ数・エポックなど他設定の変更も試行します。このバージョンのモデルをさらに改善したい場合は、Ko-fiで支援してくれることを強く願っています。支援者が増えるほど、モデルのトレーニングと強化に多くの時間を割けるようになりますが、それがない場合は難しい现状です。

私は、Ko-fiのLv.1会員限定モデルとして、ミニマリストなレンダリング用の「eddiemauro scene」を初リリースしました。プライベートモデルにアクセスしたい場合は、支援と会員登録をお願いします。また、今後はプロダクトや自動車デザインに特化したモデルも多数公開予定です。

ライセンス

安定したDiffusionのライセンスをご確認ください。今回のモデルに関しては、画像生成にあらゆる用途(商用含む)で使用可能です。禁止事項は以下の通りです:

  • 私の許可なく、このモデルをサーバーや公開オンラインサイトにアップロードすること。

  • 私の許可なく、このモデルをオンラインで共有する行為。同モデルを別の名前で配布したり、お金を稼ぐために画像生成サービスに使用すること。

  • このモデルをチェックポイントやLORAとマージし、公開・共有すること。その際は必ず私に相談してください。将来においても同様に、このモデルまたはそのマージ版を販売することは禁止されています。

支援のお願い

私のソーシャルメディアをフォローしてください。制作プロセスやデザインのヒント・ツールを紹介します。また、デザインサービスが必要な場合は、フリーランスで対応可能です。

http://eddiemauro.design/

https://www.facebook.com/eddiemauro.design

https://www.instagram.com/eddiemauro.design

https://www.linkedin.com/in/eddiemauro

https://www.behance.net/eadesign1

このモデルで生成された画像

画像が見つかりません。