IllumiYume XL (Illustrious)

詳細

ファイルをダウンロード

モデル説明

はじめに

バージョン1.0について:

  • このモデルは、「Illustrious XL 1.0」をベースに若干の修正を加え、Danbooru2023 および以前にLoRAモデルのトレーニングに使用したデータセットで学習させました。

バージョン2.0について:

  • このモデルは、Illustrious XL v3.0 v-predおよびv3.5 v-predバージョンを解放するために大量のSTARDUSTを費やす必要なく、誰もがIllustrious XLのv-predバージョンを体験できるように開発されました。

  • 私は複数の既存のXLモデルアーキテクチャを基に、このバージョンを独立して研究・開発しました。ただし、私が行った修正が多いため、これがまだ「Illustrious XL」と呼べるかどうかは不明です。

  • このモデルは、danbooru2024danbooru_newest-all データセット、およびカスタムデータセット(GPT-4.5を用いて自然言語で収集・ラベル付けし、その後自分で手動で検証)で学習させました。

  • このバージョンの開発には多くの時間と労力を費やしましたので、気兼ねなくCivitAIジェネレーターを通じて他の人が利用できるよう、ぜひ入札をご検討ください。ありがとうございます!

バージョン3.0について:

  • このバージョンでは、生成画像における詳細の安定性を保ちながら、可能な限り多様なスタイルに対応できるようにモデルを構築しました。このモデルには、Danbooruおよびe621から収集したスタイルやアーティストスタイルを含んでいます。

  • 事前学習モデルとして設計されていますが、通常通り使用できます。しかし最適化を図るには、LoRAと組み合わせるか、ご希望のスタイルを実現するためにファインチューニングすることを推奨します。

  • このモデルは、danbooru2024danbooru_newest-all データセットe621、およびカスタムデータセットで学習させました。このデータの40%は、タグと自然言語の両方でアノテーションされています。

  • このモデルは、使いやすいイプシロン予測モデルです。

バージョン3.1について:

  • このバージョンは、バージョン3.0で発生した課題を改善し、スタイルおよびアーティストスタイル(Danbooruおよびe621由来)に関する画像品質をさらに向上させました。

  • このモデルは、バージョン3.0と同じデータセットを使用して学習しましたが、再アノテーションを行い、多数の新しいアニメキャラクターを追加し、既存の品質を改善しました。

  • 1536x1536解像度での画像生成時の安定性が向上しています。

  • このバージョンには、v-pred版とe-pred版の2つのバリエーションがあります(e-pred版が先にリリースされます)。

バージョン3.2について:

  • このモデルは、3.1の改良版であり、ホットフィックスおよび強化を組み込んでいます。目部のディテールが向上し、キャラクターの解剖学的比率がより正確になっています。

  • さらに、このモデルは創造性が向上し、プロンプトの理解精度も高まっています。

  • このモデルは、1024x2048などの高解像度での画像生成も可能です(テストしたところ、画像品質は比較的良好でした)。(注意:学習時には1536x1536解像度の画像のみを使用しました。)

バージョン3.5について:

  • このモデルは、2025年5月9日時点で更新されたDanbooruデータセットを用いて、画像サイズ1536x1536で学習させました。

  • v-predバリエーションのバージョン2.0で発生した重要なバグを修正しました。

  • また、前バージョンと比較して、スタイルの安定性、解剖学的構造、およびプロンプト理解の精度が向上しています。

重要な注意事項

  • これは私が作成した初のベースモデルです。ご意見やフィードバックをぜひお寄せください。今後のバージョン改善のため、自由にご感想をお知らせください。

  • バージョン2.0はv-予測モデル(イプシロン予測とは異なります)であり、いくつかの特定のパラメーターが必要です。

  • バージョン3.0では、CFG値を低め(2〜4)に設定してください。コントラストの高い画像が生成される場合があります(なぜCFGがこの現象に影響するのかは不明ですが、調査して解決策を見つけます :v)。

現在、このモデルはCivitaiジェネレーターでは利用できません。以下のウェブサイトでご利用ください:

推奨設定:

すべての例画像は以下の設定で生成しました:

  • ポジティブプロンプト:masterpiece, best quality, amazing quality

  • ネガティブプロンプト:bad quality, worst quality, worst detail, sketch, censor, simple background, transparent background

  • CFG:5–7(バージョン3.0の場合は2–4程度に低めに設定することを推奨します)

  • Clip skip:2

  • ステップ数:20–30

  • サンプラー:Euler a / DPM++ 2S a

注意: 例画像の品質向上には、ポストプロセッシングやLoRAを使用していません。ベースモデルと上記設定、およびカスタムプロンプトのみで生成しています。

謝辞

  • 貴重なデータを共有してくださったnarugo1992さんとNyankoさんに感謝します。

私の活動を支援していただきたい場合は、Ko-fiを通じてご支援をお願いします!

このモデルで生成された画像

画像が見つかりません。