Queratogray Sketch (eddiemauro-mix)
詳細
ファイルをダウンロード
モデル説明
使用前に
Stable Diffusionの動作方法について理解しておく必要があります。モデルの起動用インターフェースとしてAutomatic1111の使用をおすすめします。
このモデルはSD 1.5モデルで学習されたものですので、完璧ではないことに注意してください。安定した生成に至るまで大量のテストを経験しました。より良いベースモデル(例:SD XL)が登場すれば、モデルを改善していきます。
これはチェックポイントデータセットです。
AI画像生成について詳しく説明するので、インスタグラムアカウントをフォローすることをおすすめします:https://www.instagram.com/eddiemauro.design/
紹介
QUERATOGRAY SKETCH (eddiemauro-mix) CHECKPOINT:こんにちは。私はプロダクトデザイナーかつ自動車デザイナーですが、AIを使った試行がとても楽しくて、設計ツールとして非常に有用だと信じています。友人である「Joell Martínez Tenjo」(プロダクトデザイナーで、アニメーションやイラストに特化)と共同でこのモデルを制作しました。彼のグレースケール/モノクロイラスト「Sketchbook」シリーズから50以上のスケッチスタイルを収集し、独自のモデルを訓練した上で、いくつかのモデルと混合して訓練を整えた結果、彼の最終スタイルの約50%を再現できました。彼のプロフィールはこちら:https://www.behance.net/queratoilustracion
このスタイルは主に人物画像の生成に特化していますが、他のLoRAと組み合わせることで、さまざまな種類の対象にも応用可能です。

私の作業を支援し、高品質なモデルをさらにアップロードできるようにするには、こちらから寄付をいただければ大変ありがたく思います:https://ko-fi.com/eddiemauro
インストール
Automatic1111(Stable Diffusion画像生成の最良のUI)を使用しており、ローカルインストール、またはColabなどのオンラインホスティングを利用することをおすすめします。オンラインの説明や動画でインストール方法を確認できます。ローカルインストールを検討している場合、こちらのオンラインチュートリアルをご覧ください。安定したインターフェイスを実現するには、最低でも6〜8GBのVRAMを持つNVIDIAグラフィックカードを推奨しています。「Microsoft Edge」で起動すると問題が少ないため、Google Chromeではトラブルが発生する可能性があります。また、「medvram」や「lowvram」のオプションを「xformers」と併用してインストールすることをおすすめします(設定方法はオンラインで検索してください)。
チェックポイントモデルのインストールが必要です。
画像生成の際は、すべての推奨事項に従ってください。それらを無視すると、良質な画像は生成できません。また、AIによる画像生成は今現在、一貫性が低く完璧ではありません。満足のいく結果を得るには時間をかけてテストを繰り返す必要があります。
画像生成の推奨事項
アクティベーショントークン/キャプション: プロンプト欄の最初の語には必ず 「sketch artstyle」 と記載してください。これがスタイルを有効にする必須条件です。記載しない場合、正しく機能しません。
その他の推奨プロンプト: プロンプト欄で以下の語を活用すると、画像生成が向上します。
・ポジティブスペースで:「grayscale, monochrome, ((solo))」
・ネガティブスペースで:「out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, color」
例として提供される画像のメタデータも確認し、同様のプロンプトをシミュレーションしてみてください。テキストインバージョン/エミュベッドやLoRAの推奨: スタイルを維持したい場合、ネガティブエミュベッドは使用しないでください。使用すると、通常のグレースケールスケッチスタイルに変化してしまいます。シンプルなネガティブプロンプト(例画像を参照)を使用することをおすすめします。これによりスタイルが破壊される可能性があります。顔や目の生成には優れているため、「フェイスレスタレーション」や他のエミュベッドは特に必要ありません。それでもネガティブエミュベッドを使用する場合は、「EasyNegative」が、ネガティブプロンプト空間向けに非常に良いテキストインバージョンであると考えます。ここからダウンロードし、「embeddings」フォルダに設置してください。
VAE: スケッチスタイルには "kl-f8-anime2" を必須で使用してください。まだインストールされていない場合、ダウンロードしてインストールしてください。
Clip Skip: 2を使用してください。
ステップ数とCFGスケール: ステップ数は「20〜40」、CFGスケールは「7〜8」が推奨されます。理想は「ステップ30、CFG7」です。次のモデルではこれらの値が変更される可能性があります。
サンプラー: 主に「EulerA」または「DPM++SDE Karras」を使用しています。EulerAは単純かつ創造性に富んでいます。他のサンプラーも好きに試してみてください。
バッチ: txt2imgでは、複数の画像を生成するため「4」の値を設定してみてください。グラフィックカードに余力がある場合は「バッチサイズ」を使用すると、同時に4枚の画像を生成できます(生成時間は増加します)。しかし、コンピュータが処理できない場合は、「バッチ数」に変更し、連続で4枚の画像を生成するようにしてください(同時にではなく時間差で)。この場合、生成時間は長くなります。
画像のアスペクト比: 512x512、768x512、512x768のサイズに設定すると良いです。大きな画像を生成するとスタイルが失われる可能性があるため、大きすぎるサイズは避けてください。大きな画像を作りたい場合は、txt2imgモードで「hires.fix」、img2imgモードで「アップスケール方法」を増加、またはUltimate SD Upscaleスクリプト拡張+ControlNet、あるいはGANモデルによるアップスケーリングを使用してください。
大きな画像を生成する方法: Stable Diffusionで大きな画像を生成するには4つの方法があります。オンラインで方法を確認できます。第一の方法 「txt2img hires.fix」 では、「4x-AnimeSharp」 というアップスケールモデルを推奨します。ここからダウンロードして「.pth」ファイルのみを取得し、「ESRGAN」フォルダに配置してください。hires.fixオプションでは「アップスケールby」に任意の値を設定し、「ノイズ除去強度」を「0.5〜0.7」に設定してください。第二の方法では、txt2imgで生成した画像を選択し、img2imgモードに切り替え、少なくとも「1.5倍」の倍率でサイズを拡大し、「ノイズ除去強度」を「0.3〜0.5」に設定してください。第三の方法では、img2imgと同じ設定を使い、「ControlNet」拡張機能の「タイルモード」を有効化し、「Ultimate SD Upscale」スクリプトも使用します。詳しくはこちらのチュートリアルをご覧ください。最後の方法では、生成された画像をtxt2imgから「エクストラ」に送り、GANモデルを選択して拡大します。この際、「4x-UltraSharp」モデルも使用可能です。
制作過程をよりコントロールするため: 「ControlNet」拡張を使って、生成する画像の形状をよりしっかり制御できます。スケッチを用いて試すことも可能です。「スクリブル」や「ラインアート」モードを活用してください。この導入は、拡張機能のインストールと使い方の学習が必須です。多くのオンライン動画が紹介されています。
プロンプトのコピー(画像メタデータ用): お手元の例画像をここからダウンロードし、Automatic1111の「PNG info」タブに貼り付けてください。
例のプロンプト:
ポジティブプロンプト:
A young man, sketch artstyle, grayscale, monochrome, ((solo))スタイルを失うポジティブプロンプト:
A young man, sketch artstyle, grayscale, monochrome, ((solo)), ((masterpiece)), HDR, highly detailed, professionalネガティブプロンプト:
out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, colorスタイルを失うネガティブプロンプト:
EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, colorステップ数:20〜40(EulerAでは20で十分です。DPM++SDE Karrasも利用可能ですが、EulerAが大多数で優れています)。
CFGスケール:7〜8(7が理想)。
今後の予定
既にこのモデルの改善を試行中です。現在のモデルは512x512のアスペクト比で学習していますので、768(より大きなサイズ)を対象に再学習する予定です。また、キャプションの変更、ステップ数、エポック数など他の設定も試行します。このバージョンのより良いモデルを手に入れたい場合は、Ko-fiでの支援を継続していただければ幸いです。支援してくれる方が増えれば、モデルのトレーニングや改善にさらなる時間を割くことができますが、そうでなければ難しいです。

私は初のプライベートモデル「eddiemauro scene」を、Ko-fiメンバーシップLv.1向けにリリースしました。これはミニマルな風景を作る専用モデルです。プライベートモデルにアクセスしたい場合は、支援をいただき、このメンバーシップに登録してください。今後もプロダクトデザインおよび自動車デザインに特化したモデルをさらにアップロードしていく予定です。
ライセンス
Stable Diffusionのライセンスについて、こちらのリンクをご覧ください。本モデルに関しては、実験目的でのみ使用することを許可します。以下は禁止事項です:
私の許可なく、サーバーまたは公開オンラインサイトにこのモデルをアップロードすること。
私の許可なく、このモデルをオンラインで共有すること。ただし、別名で投稿する、またはこのモデルをアップロードして金銭を目的とした画像生成サービスで使用することは禁止。
他のチェックポイントやLoRAと統合して公開・共有すること。その場合は、必ず私に相談してください。将来的には、
このモデルまたはその統合モデルを販売すること。
支援について
私のソーシャルネットワークをフォローしてください。制作過程やデザインのコツ・ツールについて共有します。また、個人のウェブサイトもご覧ください。デザインサービスが必要な場合はフリーランスで対応可能です。
https://www.facebook.com/eddiemauro.design
https://www.instagram.com/eddiemauro.design










