Mangaz B&W (Naruto and Dbz-eddiemauro)

詳細

ファイルをダウンロード

モデル説明

使用前に

  • Stable Diffusionの仕組みを理解しておく必要があります。モデルを起動するには、Automatic1111のようなインターフェースを使用することをお勧めします。

  • このモデルはSD 1.5をベースに学習されたものであり、完璧ではないことを認識してください。安定した生成結果を得るまでに、膨大なテストを繰り返しました。今後、より優れたベースモデル(例:SD XL)が登場した際には、モデルを改善する予定です。

  • これはLORAモデルであり、チェックポイントの拡張として使用することをお勧めします。リアリスティックなデータセットのモデルを使用することを推奨します。

  • AI画像生成についての解説をInstagramで行っていますので、ぜひフォローしてください:https://www.instagram.com/eddiemauro.design/

紹介

MANGAZ B&W (NarutoDbz-eddiemauro) LORA:こんにちは、私はプロダクト・自動車デザイナーで、AIを使った実験にとてもワクワクしています。これはデザインに非常に役立つツールだと考えています。このLORAはあくまで趣味用です。実験や学習に使えるマンガのグレースケールスタイルを探していたところ、自分が最も好きな2つのアニメ——『ナルト』と『ドラゴンボール』を組み合わせたスタイルを開発しました。これにより、これらのアニメ風の画像を作成できます。

私の作業を支援し、より高品質なモデルのアップロードを助けてくれる方は、以下より寄付をお願いします。心より感謝します:https://ko-fi.com/eddiemauro

インストール

  • 私はStable Diffusionの画像生成に最適なUIであるAutomatic1111を使用しています。ローカルにインストールするか、Colabなどのオンラインホスティングサービスで利用することをお勧めします。オンラインでインストール手順やチュートリアル動画が多数公開されています。ローカルにインストールする場合は、このチュートリアルを参考にしてください。安定したインターフェースを確保するために、少なくとも6〜8GBのVRAMを搭載したNVIDIAグラフィックカードが必要です。また、「Microsoft Edge」で起動することを推奨します。「Google Chrome」では問題が発生することがあります。「xformers」に加えて、「medvram」または「lowvram」オプションのインストールも検討してください(オンラインで方法を検索してください)。

  • これはLoraモデルです。インストール方法については、この動画をご覧ください。ファイルをダウンロードして、Loraフォルダ内に配置するだけです。Loraファイルの拡張子は「.safetensor」で、チェックポイント(1GB以上になることも)よりサイズが小さめです。

  • 使用するには、リアリスティックなビジュアルや3D/レンダリングに特化したチェックポイントモデルもインストールする必要があります。

  • 良い画像を生成するには、以下のすべての推奨事項を厳守してください。守らないと、高品質な画像は生成できません。また、現在のAI画像生成技術はまだ一貫性や完成度に欠けており、十分な時間と試行錯誤を重ねる必要があります。

画像生成の推奨設定

  • 最適なチェックポイントモデル: SD 1.5ベースのモデルを使用してください。必ず以下のチェックポイントを事前にダウンロード・インストール・読み込みしてください:『Narutoスタイル』には"Fresh Draw v1"、『DBZスタイル』には"Anylora"

  • アクティブ化トークン/キャプション: プロンプトの最初の単語は必ず “emangaz” とし、その後に希望するスタイルに応じて “shippuden”(ナルト風)または “dbz”(ドラゴンボール風)を追加してください。この設定は必須です。設定しないと正しく機能しません。

  • その他の推奨プロンプト: プロンプト内で以下のキーワードを使用すると画像生成が向上します。
     ポジティブ空間: “((monochrome)), grayscale, 8k, ((masterpiece)), HDR, professional”
     ネガティブ空間: “(worst quality:2), (low quality:2), ((NSFW)), Cleavage, Pubic Hair, Nudity, Naked, Au naturel, Watermark, Text, censored, ((color)), jpeg artifacts, blurry, ((blind)), ((strabismus))”
     また、例示画像のメタデータを確認してプロンプトを模倣することもおすすめです。キャラクターや画像スタイルを生成するための推奨語句:

SHIPPUDEN

- ニンジャ:ninja, hairband(ニンジャ少女用), forehead protector, kunai, cape, weapon, sword, sandals, weapon on back, konohagakure symbol
- ナルト:naruto, facial mark, forehead protector
- 女の子:ponytail, long hair, short hair
- カカシ:kakashi, ninja mask, forehead protector
- サスケ:japanese clothes, spiked hair, black hair, cape
- 怪物(bijuu):kurama, monster, giant

DBZ

- サイヤ人戦士:muscular, spiked hair, wristband, gloves, veins, super saiyan, saiyan armor
- その他:chinese clothes

いずれにも共通

- シンプル:simple background, white background
- 戦闘シーン:dirty
- 夜間シーン:night sky
- その他:buildings, landscape, mountain, forest
- 構図:close-up, portrait, upper body, full body

  • 推奨するテキスト逆転・埋め込み/LORAツール: ネガティブプロンプト空間で「EasyNegative」を使用することをお勧めします。こちらからダウンロードし、「embeddings」フォルダに配置してください。さらに「Detail Tweaker」を使用して画像の細部を減らすことも可能です。こちらからダウンロードし、Loraとしてインストールして、ポジティブプロンプトで「-0.5」の値を使用してください。チェックポイントが細部を過剰に含んでいる場合に有効ですが、ミニマリズムが望ましい場合は使用しないでください。これによりオブジェクトの形状が大きく変化することがあります。

  • Loraの重み: 現在このモデルは 0.5〜0.7 の範囲で良好に機能します。0.8を超えると形状が崩れ、0.4以下ではスタイルが発揮されません。理想は0.6ですが、0.5の方が良い場合もあります。0.5未満の設定でも興味深い結果が出ることがあります。

  • VAE:kl-f8-anime2」の使用を推奨します。他のVAEを使用すると、ややリアリスティックな画像が生成されます。

  • Clip Skip: 学習時には2を使用しているため、2に設定してください。

  • ステップ数とCFGスケール: ステップ数は「25–35」、CFGスケールは「6–7」を推奨します。理想的な設定は:ステップ30、CFG6。今後のモデルではこれらの値が変更される可能性があります。

  • サンプラー: DPM2a(スタイル強め)とDPM++2Sa Karras(シンプルで細部を減らす)を使用してください。(オプション:DPM2 Karras, DPM2a Karras)その他のサンプラーも試してみてください。

  • バッチ生成: txt2imgでは、複数画像を生成するためにバッチサイズを「4」に設定することをお勧めします。高性能なグラフィックカードをお持ちであれば、「Batch size」を設定して同時に4枚生成できます(生成時間が長くなります)。ただし、PCの性能が低い場合は「Batch count」を設定し、1枚ずつ順次生成してください(全体の生成時間は長くなりますが、安定します)。

  • 画像アスペクト比: 512x512、768x512、512x768のサイズをお試しください。より大きな画像を生成するには、txt2imgモードで 「hires.fix」 を必ず使用してください。(高品質画像生成には必須)またはimg2imgモードで「増幅方法」を使用するか、「Ultimate SD Upscale」スクリプト拡張機能+ControlNetを活用するか、GANモデルで単純にアップスケールすることもできます。

  • 大きな画像の作成方法: Stable Diffusionで大きな画像を生成するには4つの方法があります(オンラインで方法を確認できます)。
     1つ目: txt2imgの「hires.fix」を使用。アップスケールモデルとして 「R-ESRGAN 4x+Anime6B」 を推奨します。「upscale by」の値を設定し、「denoise strength」を「0.4」にします。
     2つ目: txt2imgで生成した画像をimg2imgモードで読み込み、画像サイズを「1.5倍以上」に増やし、「denoise strength」を「0.3–0.5」に設定します。
     3つ目: img2imgと同じ設定を使い、「ControlNet」の「tile」モードと「Ultimate SD Upscale」スクリプトを有効にします。詳しくはこのチュートリアルをご覧ください。
     4つ目: txt2imgで生成した画像を「extras」にアップロードし、GANモデル(例:「4x-UltraSharp」)を選択してアップスケールします。

  • 生成の制御を強化: ControlNet拡張機能を使用して、求めている形状をより正確に生成できます。スケッチと組み合わせて「Scribble」または「Lineart」モードを試してみてください。この拡張機能のインストールと使用方法については、多くのオンライン動画が参考になります。

  • プロンプトのメタデータコピー: 私の例示画像をダウンロードし、Automatic1111の「PNG info」タブに読み込むことで、プロンプトを再現できます。

例:プロンプト

ポジティブプロンプト:
emangaz, shippuden, 1girl, ((monochrome)), grayscale, 8k, ((masterpiece)), HDR, professional lora:emangaz2:0.7

ネガティブプロンプト:
Easynegative, (worst quality:2), (low quality:2), ((NSFW)), Cleavage, Pubic Hair, Nudity, Naked, Au naturel, Watermark, Text, censored, ((color)), jpeg artifacts, blurry, ((blind)), ((strabismus))

ステップ数: 30–35(DPM2a(スタイル強め)またはDPM++2Sa Karras(シンプル・細部少なめ)(オプション:DPM2 Karras, DPM2a Karras))

CFGスケール: 6–7(理想値:6)

今後の予定

現在、このモデルの改善を進めています。より良いバージョンをご希望の場合は、Ko-fiで支援してください。多くの人が支援してくれれば、より多くの時間をモデルの訓練と改善に充てられます。支援がなければ、改善は難しいです。

私は、Ko-fiメンバーシップLv.1向けに初のプライベートモデル「eddiemauro scene」を公開しました。これは、レンダリング用のミニマリスティックな風景生成モデルです。プライベートモデルにアクセスしたい方は、このメンバーシップにご登録ください。今後は製品・自動車デザインに特化したモデルをさらにアップロードする予定です。

ライセンス

Stable Diffusionのライセンスについてはこちらをご覧ください。本モデルに関しては、画像生成用途では自由に使用可能です。ただし、以下の行為は禁止されています:

  • 私の許可なく、このモデルをサーバーや公開オンラインサイトにアップロードすること。
  • 私の許可なく、このモデルをそのまままたは名前を変えてオンラインで共有すること、またはこのモデルを使用して画像生成サービスを有料で提供すること。
  • このモデルをチェックポイントやLoraと統合して公開・共有すること。事前に必ず私にご連絡ください。
  • このモデルやその統合版を販売すること。

支援について

SNSで私の活動をフォローしてください。デザインの制作プロセスやツールのヒントを公開しています。また、私のウェブサイトでは、デザインの受託サービスも行っています。

http://eddiemauro.design/

https://www.facebook.com/eddiemauro.design

https://www.instagram.com/eddiemauro.design

https://www.linkedin.com/in/eddiemauro

https://www.behance.net/eadesign1

このモデルで生成された画像

画像が見つかりません。