Animagine XL V3.1

Animagine XL 3.1は、Animagine XL V3シリーズのアップデートであり、前バージョンのAnimagine XL 3.0を強化したものです。このオープンソースのアニメ風テキスト画像生成モデルは、より高品質なアニメスタイルの画像を生成するために改良されています。有名なアニメシリーズからの広範なキャラクター、最適化されたデータセット、そしてより優れた画像生成のための新しい審美的タグが含まれています。Stable Diffusion XLを基盤として構築されたAnimagine XL 3.1は、アニメキャラクターの正確で詳細な表現を生成することで、アニメファン、アーティスト、コンテンツクリエイターにとって貴重なリソースとなることを目指しています。

モデルの詳細

開発者: Cagliostro Research Lab
共同開発: SeaArt.ai
モデルタイプ: ディフュージョンベースのテキストから画像を生成するモデル
モデル説明: Animagine XL 3.1は、テキストプロンプトから高品質なアニメ画像を生成します。手の解剖学的正確性が向上し、概念理解とプロンプト解釈が進化しています。
ライセンス: Fair AI Public License 1.0-SD
微調整元: Animagine XL 3.0

使用ガイドライン

タグの順序

最適な結果を得るためには、以下のような構造化されたプロンプトテンプレートに従うことを推奨します。これはモデルのトレーニング方法に合わせたものです：

1girl/1boy, キャラクター名, どのシリーズから, その他の要素は順序自由。

特殊タグ

Animagine XL 3.1は、結果を品質、レーティング、生成年、審美的スタイルに導くために特別なタグを使用します。これらのタグなしでも画像を生成できますが、より良い結果を得るために使用することを推奨します。

品質修正子

品質タグは、スコアと投稿評価の両方を考慮し、バランスの取れた品質分布を実現します。明確さを高めるため、「high quality」を「great quality」に変更するなど、ラベルを洗練しました。


品質修正子	スコア基準
masterpiece	        > 95%
best quality	        > 85% & ≤ 95%
great quality	        > 75% & ≤ 85%
good quality	        > 50% & ≤ 75%
normal quality	        > 25% & ≤ 50%
low quality	        > 10% & ≤ 25%
worst quality	        ≤ 10%

レーティング修正子

レーティングタグも簡素化・明確化し、異なるモデルに共通して適用できるグローバルルールを確立しました。たとえば、「rating: general」は単に「general」、「rating: sensitive」は「sensitive」に簡略化されています。


レーティング修正子	レーティング基準
safe	            General
sensitive	    Sensitive
nsfw	            Questionable
explicit, nsfw	    Explicit

年代修正子

結果を特定の現代的またはヴィンテージなアニメアートスタイルに正確に導くために、年代範囲を再定義しました。現在と過去の時代に関連性の高い範囲に焦点を当て、簡素化しています。


年タグ	年代範囲
newest	        2021～2024
recent	        2018～2020
mid	        2015～2017
early	        2011～2014
oldest	        2005～2010

審美的タグ

視覚的魅力に基づくコンテンツ分類を洗練するために、審美的タグを強化しました。これらのタグは、アニメデータに特化して訓練された専用のViT（Vision Transformer）画像分類モデルの評価結果から導出されています。この目的のために、トレーニング前にコンテンツの審美的価値を評価するモデルshadowlilac/aesthetic-shadow-v2を使用しました。これにより、各コンテンツが単に関連性・正確性だけでなく、視覚的にも魅力的であることが保証されます。


審美的タグ	       スコア範囲
very aesthetic	       > 0.71
aesthetic	       > 0.45 & < 0.71
displeasing	       > 0.27 & < 0.45
very displeasing       ≤ 0.27

推奨設定

高審美的な画像を生成するには、以下のようなネガティブプロンプトを使用することをお勧めします：

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

高品質な結果を得るには、プロンプトの先頭に以下を付加することをお勧めします：

masterpiece, best quality, very aesthetic, absurdres

また、分類自由ガイド（CFG Scale）を5～7程度に下げ、サンプリングステップを30未満にし、サンプラーとしてEuler Ancestral（Euler a）を使用することを推奨します。

多様なアスペクト比解像度

このモデルは、以下の解像度で画像を生成できます：

解像度	アスペクト比
1024 x 1024	1:1 正方形
1152 x 896	9:7
896 x 1152	7:9
1216 x 832	19:13
832 x 1216	13:19
1344 x 768	7:4 横長
768 x 1344	4:7 縦長
1536 x 640	12:5 横長
640 x 1536	5:12 縦長

謝辞

Animagine XL 3.1の開発とリリースは、以下の個人および団体の貴重な貢献と支援がなければ実現できませんでした：

SeaArt.ai: 協力パートナーおよびスポンサー。
Shadow Lilac: 審美的分類モデルaesthetic-shadow-v2の提供。
Derrian Distro: LoRA Easy Training Scriptsから派生したカスタム学習率スケジューラ。
Kohya SS: 総合的なトレーニングスクリプトの提供。
Cagliostrolab コラボレーター: モデルトレーニング、プロジェクト管理、データキュレーションへの献身。
初期テスト担当者: 貴重なフィードバックと品質保証への協力。
NovelAI: 审美的タグの革新的なアプローチが、私たちの実装にインスピレーションを与えてくれました。

アニメスタイル画像生成の限界を押し広げるために、ご協力いただき誠にありがとうございます。

制限事項

Animagine XL 3.1はアニメスタイル画像生成における大きな進歩を示していますが、その制限を認識することが重要です：

アニメ専用: このモデルはアニメスタイルの画像生成に特化しており、リアルな写真の生成には適していません。
プロンプトの複雑さ: 短くシンプルなプロンプトから高品質な結果を期待するユーザーには向いていない場合があります。トレーニングの焦点は審美的洗練ではなく概念理解にあり、希望する出力を得るにはより詳細で具体的なプロンプトが必要となることがあります。
プロンプト形式: Animagine XL 3.1は自然言語のプロンプトではなく、Danbooru風タグに最適化されています。最良の結果を得るには、適切なタグと構文でプロンプトを構成することをお勧めします。
解剖学的表現と手の描画: 解剖学的表現と手の描画は改善されていますが、依然としてこれらの領域で最適でない結果が出ることがあります。
データセットサイズ: Animagine XL 3.1のトレーニングに使用されたデータセットは約87万枚の画像で、前バージョンのデータセット（120万枚）と合わせて合計約210万枚の画像となります。規模としては十分ですが、「究極の」アニメモデルとしての観点からは限定的である可能性があります。
NSFWコンテンツ: Animagine XL 3.1はバランスの取れたNSFWコンテンツ生成を意図していますが、明示的にプロンプトしなくてもNSFWな結果を生成する可能性があることにご注意ください。

これらの制限を認識することで、Animagine XL 3.1のユーザーに対して透明性を確保し、現実的な期待を設定することを目指しています。これらの制約にもかかわらず、このモデルはアニメスタイル画像生成における大きな前進であり、アーティスト、デザイナー、愛好家にとって強力なツールであると信じています。

ライセンス

Animagine XL 3.1は、Animagine XL 3.0に基づき、Fair AI Public License 1.0-SDライセンスの下に提供されています。このライセンスはStable Diffusionモデルのライセンスと互換性があります。主なポイント：

変更の共有: Animagine XL 3.1を変更した場合、変更内容と元のライセンスを共有しなければなりません。
ソースコードの公開: 変更版がネットワークからアクセス可能である場合、他のユーザーがソースコードを取得できる方法（ダウンロードリンクなど）を提供してください。これは派生モデルにも適用されます。
配布条件: いかなる配布も、このライセンスまたは同様のルールを持つライセンスの下で行わなければなりません。
遵守: 違反がある場合、30日以内に是正しなければライセンスが終了します。これは透明性とオープンソースの価値への従順を重視しています。

このライセンスの選択は、Animagine XL 3.1をオープンで変更可能に保ち、オープンソースコミュニティの精神に沿うことを目的としています。貢献者とユーザーを保護し、協力的で倫理的なオープンソースコミュニティの形成を促進します。これにより、モデルはコミュニティからの入力を享受するだけでなく、オープンソース開発の自由を尊重します。

最後に、Cagliostro Labの公式サーバーを公開しています：https://discord.gg/cqh9tZgbGc

Discordサーバーへの参加をお気軽にどうぞ。
寄付やコーヒーをご馳走したい方は、こちらからご支援ください。

どうもありがとうございました ^_^

モデルタイプ	チェックポイント
ベースモデル	SDXL 1.0
公開日	3/21/2024

詳細

ファイルをダウンロード

モデル説明