ChromaYume NoobAI-XL (NAI-XL)

詳細

ファイルをダウンロード

モデル説明

概要

  • このモデルは、NOOBAI XL-VPred 1.0 のアーキテクチャをベースに、いくつかの構造的変更を加えて構築されています。

    • バージョン1.0から3.0:[Danbooru2024](https://huggingface.co/datasets/deepghs/danbooru2024) データセットに加え、[Yande Full](https://huggingface.co/datasets/deepghs/yande_full?not-for-all-audiences=true)[e621](https://huggingface.co/datasets/deepghs/e621_index?not-for-all-audiences=true) を使用して学習し、学習中に [NOOBAI XL-VPred 1.0](/model/833294/noobai-xl-nai-xl)[Illustrious XL 1.0](/model/1232765/illustrious-xl-10?modelVersionId=1389133) を教師モデルとして利用しました。

    • バージョン2.0:以前のデータに加え、インターネット上の複数のソースから5万枚以上のリアルなキャラクター画像を追加して学習しました。

    • バージョン3.0では、データセットを再構成し、ChatGPT o3-mini を用いてより多くのデータラベルを追加した後、手動で再確認を行いました。

    • バージョン4.0では、モデルは [danbooru2024](https://huggingface.co/datasets/deepghs/danbooru2024)[danbooru_newest-all](https://huggingface.co/datasets/deepghs/danbooru_newest-all)[e621](https://huggingface.co/datasets/deepghs/e621-2024_index)[e621_newest](https://huggingface.co/datasets/deepghs/e621_newest)[gelbooru_full](deepghs/gelbooru_full)[yande_full](https://huggingface.co/datasets/deepghs/yande_full) に加え、独自に収集・ラベリングしたカスタムデータセット(GPT-4.5を用いて自然言語でラベル付けし、その後自分で手動検証)で学習されました。

  • バージョン1.0:このモデルは、複数のアートスタイル(トリガープロンプトの使用を通じて)と良好な人体構造をバランスよく生成することに焦点を当てています。

  • バージョン2.0:このバージョンは、人体構造の改善に重点を置き、トリガープロンプトの使用によりより現実的なキャラクターの生成を可能にしています。ただし、このバージョンでは複数のアートスタイルにおける画像生成品質が低下する可能性があります。

  • バージョン3.0:このバージョンは、複数のスタイルでの画像生成(バージョン1.0と同様)を可能にしつつ、より現実的で(バージョン2.0よりも生々しい)人体構造の改善を実現しています。ただし、目的の画像を得るには、出力に大きな影響を与えるため、正確な記述プロンプトを入力する必要があります。

  • バージョン4.0では、学習に使用した膨大なデータに適応するため、モデルをいくつかの変更を加えて再構築しました。さらに、CLIP、VAE、UNetを含むモデルのすべての部分を訓練し直す必要がありました。このバージョンでは、画像スタイルの生成精度が向上し、キャラクターの人体構造も改善されました。また、バージョン2.0および3.0で発生していた問題を修正しました。

重要な注意点

  • このモデルは私が個人的に再構築したものですので、フィードバックを頂けると大変ありがたいです。あなたの洞察は私を励ますだけでなく、このモデルの強みと弱みをより深く理解し、今後の改良に役立つでしょう。

  • これはε予測とは異なり、V予測モデルであり、特定のパラメータ設定が必要です。ユーザーガイドを以下でご確認ください:here

現在、このモデルはCivitai Generation経由では利用できません。以下のウェブサイトでご利用いただけます:

リアルなキャラクターを生成するための設定

バージョン2.0および3.0向け:生成時に以下のプロンプトを追加してください

  • ポジティブプロンプト:realistic, cosplay, real life, photorealistic
  • ネガティブプロンプト:illustration, blur, film grain, noise, sketch, comic, cartoon, toon, oil painting (medium), flat color, outline, 3D, 2.5D, 2D, unrealistic, game engine style, anime coloring, smooth skin

推奨設定

  • ポジティブプロンプト:masterpiece, best quality, amazing quality
  • ネガティブプロンプト:bad quality, worst quality, worst detail, sketch, censor, simple background, transparent background
  • CFG:4–6
  • Clip skip:2
  • ステップ:20–30
  • サンプラー:Euler a

提供:@Ligmanese

  • サンプラー:Euler Ancestral CFG++
  • スケジュールタイプ:Simple
  • サンプリングステップ:25–30
  • CFGスケール:1.2–1.5

注記:

  • 例示画像には、任何のポストプロセッシングやLoRAを使用していません。すべての画像は、この設定とプロンプトのみで私のベースモデルから生成されています。

  • 比較および独立した評価のために、これらの例示画像のプロンプトは、さまざまなソースおよび著者から取得しています。

謝辞

  • 貴重なデータを共有してくださったnarugo1992さんとNyankoさん、そして素晴らしいモデルを提供してくださったLaxhar Labさんに感謝します。

  • noobRealモデルを作成してくださった@Sennkeさんに感謝します。このモデルは、ChromaYumeバージョン2.0の改善に多くのアイデアを与えてくれました。

もし私の作業を支援したい場合は、Ko-fiを通じてご協力ください!

このモデルで生成された画像

画像が見つかりません。