Queratogray Sketch (eddiemauro-mix) LORA
詳細
ファイルをダウンロード
モデル説明
使用前に
Stable Diffusionの仕組みを理解しておく必要があります。モデルを起動する際には、Automatic1111のようなインターフェースを使用することをお勧めします。
このモデルはSD 1.5をベースに学習されていますので、完璧ではないことをご理解ください。安定した生成結果を得るまで、多くの試行錯誤を重ねてきました。今後、より優れたベースモデル(例:SD XLなど)が登場した際には、モデルを改善していきます。
これはLORAモデルです。チェックポイントの拡張機能として使用することをお勧めします。リアリスティックなデータセットのモデルを使用することを推奨します。
AI画像生成に関する情報を発信している私のInstagramアカウントをフォローしてください:https://www.instagram.com/eddiemauro.design/
紹介
Queratogray Sketch (eddiemauro-mix) LORA:こんにちは、私は製品および自動車デザイナーで、AIを使ってデザインを試すことにとてもワクワクしています。このツールはデザインに非常に役立つと考えています。このLORAは単なる趣味のためのものです。私は製品デザイナーであり、アニメーションとイラストレーションに特化した友人「Joell Martínez Tenjo」と協力することにしました。彼の「Sketchbook」シリーズから50以上のグレースケール/モノクロのスケッチスタイルを収集し、それらを基にモデルを学習させ、他のモデルと組み合わせて学習を安定化させました。その結果、彼の最終的なスタイルの約50%を再現できました。彼のプロフィールはこちらでご確認ください:https://www.behance.net/queratoilustracion
これは私が以前作成したチェックポイントのLoraバージョンです:/model/80357/queratogray-sketch-eddiemauro-mix

私の作業を支援し、より高品質なモデルのアップロードを助けてくださりたい場合は、以下から寄付をしていただけますと大変感謝します:https://ko-fi.com/eddiemauro
インストール
私はStable Diffusionの画像生成に最適なUIであるAutomatic1111を使用しています。ローカルにインストールするか、Colabやその他のホスティングサービスを使ってオンラインで利用することをお勧めします。オンライン上でそのインストール方法の手順や動画が多数公開されています。ローカルにインストールする場合、このチュートリアルを参考にしてください。安定したインターフェースを実現するには、少なくとも6〜8GBのVRAMを搭載したNVIDIAのグラフィックカードが必要です。また、起動時は「Microsoft Edge」を使用することをお勧めします。「Google Chrome」では問題が発生することがあります。「xformers」の他に、「medvram」または「lowvram」オプションのインストールも検討してください(オンラインで方法を調べてください)。
これはLoraモデルです。そのインストール方法については、この動画をご覧ください。ファイルをダウンロードして、Loraフォルダに配置するだけです。Loraファイルの拡張子は“.safetensors”であり、通常チェックポイント(数GB以上)よりサイズが小さくなります。
使用するにはチェックポイントモデルもインストールする必要があります。リアリスティックな描写やドローイングに焦点を当てたモデルを選んでください。
良い画像を生成するには、以下のすべての推奨事項に従ってください。そうしないと、高品質な画像を生成することは不可能です。また、現在のAI画像生成はまだ完全ではなく一貫性が劣るため、十分な試行錯誤と時間の投資が必要です。
画像生成の推奨事項
最適なチェックポイントモデル:SD 1.5ベースのモデルを使用してください。以下のチェックポイントをお勧めします:“Fresh Photo v2”(よりリアリスティック。全用途に適しています)、“Fresh Magic v1.5”(リアリスティックとアニメの中間。デジタルスタイルで、風景に特に適しています)、“Fresh Draw v1”(アニメ/マンガ風。風景にはやや不向き)。それぞれの最新版を試してください。
アクティベーショントークン/キャプション:プロンプトの最初の単語は必ず “sketch artstyle” と入力してください。これを省略すると正しく機能しません。
その他の推奨プロンプト:プロンプトのポジティブ側では、“grayscale, monochrome, ((solo))”を使用してください。ネガティブ側では、“out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, color”を推奨します。また、サンプル画像のメタデータを確認し、そのプロンプトを模倣することもできます。
推奨されるテキスト逆転/埋め込みまたはLoraツール:スタイルを保持したい場合は、ネガティブ埋め込みは使用しないでください。使用すると、通常のグレースケッチスタイルに変わってしまいます。ネガティブプロンプトはシンプルに保つことが重要です(サンプル画像を参考にしてください)。これは、顔と目を生成するのに優れており、「face restoration」や他の埋め込みはそれほど必要ありません。ネガティブ埋め込みを使用する場合、「EasyNegative」が最適なテキスト逆転の一つです。こちらからダウンロードし、ファイルを「embeddings」フォルダに配置してください。
VAE:スケッチスタイルには必ず"kl-f8-anime2"を使用してください。ご持っていない場合はダウンロードしてインストールしてください。
Clip Skip:2を設定してください。
ステップ数とCFG:ステップ数は「20-40」、CFGスケールは「7-8」を使用することをお勧めします。理想的な値は:ステップ30、CFG7です。今後のモデルでは、これらの値が変わる可能性があります。
サンプラー:主に「EulerA」または「DPM++SDE Karras」を使用しています。Eulerはシンプルで創造性が高い傾向があります。他のサンプラーもお試しください。
バッチ:txt2imgでは、1回の生成で複数の画像を得るためにバッチサイズを「4」に設定してください。高性能なグラフィックカードをお持ちの場合は「Batch size」を使用して同時に4枚の画像を生成できます(生成時間が長くなります)。ただし、PCの性能が低い場合は「Batch count」を使用し、4枚の画像を順次生成してください(生成時間は長くなりますが、安定します)。
画像アスペクト比:512x512、768x512、512x768 のサイズをお勧めします。大きな画像を生成するとスタイルが失われることがあるため、より大きな画像を作成したい場合は、txt2imgモードで「hires.fix」、img2imgの拡大方法、または「Ultimate SD Upscale」スクリプト拡張機能+ControlNetを、あるいはGANモデルでのアップスケーリングをご使用ください。
大きな画像の作成方法:Stable Diffusionで大きな画像を作成するには4つの方法があります。オンラインで方法を確認してください。最初の方法 「txt2img hires.fix」 では、アップスケールモデル 「4x-AnimeSharp」 を使用することをお勧めします。こちらからダウンロード(“.pth”ファイルのみ)し、「ESRGAN」フォルダに配置してください。hires.fixオプションでは「upscale by」の値を設定し、「denoise strength」は「0.5-0.7」に設定してください。2番目の方法では、txt2imgで生成した画像をimg2imgモードに切り替え、少なくとも「1.5倍」に拡大し、「denoise strength」を「0.3-0.5」に設定します。3番目の方法では、img2imgと同じ設定を使用し、「ControlNet」拡張機能の「tile」モードと「Ultimate SD Upscale」スクリプトを有効にします。詳細はこのチュートリアルをご覧ください。最後の方法では、txt2imgで生成した画像を「extras」に渡し、GANモデルを選択してアップスケーリングします。「4x-UltraSharp」モデルも利用できます。
生成の制御を高める:希望する形状をより正確に生成するために「ControlNet」拡張機能を使用してください。スケッチで試すこともできます。「Scribble」または「Lineart」モードを利用してください。この拡張機能のインストールと使い方については、多くのオンラインチュートリアルが利用可能です。
プロンプトの画像メタデータへのコピー:以下のサンプル画像をダウンロードし、Automatic1111の「PNG info」タブに読み込んでください。
例:プロンプト
ポジティブプロンプト:
A young man, sketch artstyle, grayscale, monochrome, ((solo))
ポジティブプロンプト(スタイルが失われる):
A young man, sketch artstyle, grayscale, monochrome, ((solo)), ((masterpiece)), HDR, highly detailed, professional
ネガティブプロンプト:
out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, color
ネガティブプロンプト(スタイルが失われる):
EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, color
ステップ数: 20-40(EulerAでは20で十分です。DPM++SDE Karrasも使えますが、EulerAが一般的に優れています)
CFGスケール: 7-8(理想的には7)
今後の展開
私はすでにモデルの改良を進めています。このバージョンのより良いモデルが欲しい場合は、Ko-fiで応援してください。支援者が増えるほど、私はモデルの訓練と改良に更多の時間を投資できます。そうでなければ、改善はできません。

私は、私のKo-fiメンバーシップLv.1向けに最初のプライベートモデル「eddiemauro scene」をリリースしました。これはミニマリストな風景の生成向けです。プライベートモデルにアクセスしたい場合は、このメンバーシップにご登録ください。今後、製品や自動車デザインに特化した新しいモデルを追加していきます。
ライセンス
Stable Diffusionのライセンスについてはこちらをご覧ください。このモデルの使用は実験目的に限定してください。以下の行為は禁止です:
私の許可なしに、このモデルをサーバーや公開のオンラインサイトにアップロードすること。
私の許可なしに、このモデルを他の名前でオンラインで共有したり、このモデルを使用して画像生成サービスを有料で提供すること。
チェックポイントまたはLoraと統合して公開・共有すること。まず私に連絡してください。
このモデルまたはこれを用いた統合モデルを販売すること。
支援について
私のソーシャルネットワークをフォローしてください。制作プロセスやデザインのヒント、ツールを公開しています。また、私のウェブサイトをご覧になり、デザインサービスをご希望の場合は、フリーランスとしてご対応しています。
https://www.facebook.com/eddiemauro.design
https://www.instagram.com/eddiemauro.design









