SDXL-baseを元に、180万枚のアニメ画像データセットで訓練されたアニメベースモデル。かわいく、賢く、柔軟で、あなたのためのモデル！

はい、これは新しいSDXLアニメベースモデルです

解剖学において、他のすべてのポニー以外のアニメモデルを上回る
一般知識とSFW面において、ポニーとNAI3を上回る
8,000人以上のアーティストスタイル（ワイルドカード）、即座に使える汎用スタイルが少数
完全なカラーパレット、完全な明るさ範囲、優れたベースの美的感覚
元のSDXLからの知識を保持、ロボトミーなし
おそらくあなたがこれまで見逃していた独特な体験

GPU時間と質の高いデータセットを手に入れたため、SFW/NSFWアニメの概念について広範な知識を持ちながら、以前のポニーなどのようにSDXLからすべてをロボトミー化しないアニメモデルを訓練できるのか興味が出ました。このチェックポイントは、その答えであり概念実証です。まだ非常に実験的で、改善・修正すべき点が多数ありますが、既に使用可能で、多くの面で優れており、オープンソースチェックポイントに欠けていた機能を備えています。

Tofuは4th tailと（ほぼ）同じデータセットを使用しており、人気キャラクターの生成、アーティストスタイルの模倣、Booruタグと概念の大部分の認識が可能です。自然なテキスト混合キャプションと独自の訓練手法もすべて同じです。

手の指のような細部が美しく、有名な実世界の場所（SDXL-base由来）や美しい風景・都市風景の背景も利用可能。
ポージングとNSFWは問題ありません。ポニーほどうまくはいかないとは言え、ヴァニラポニーと比較してもそれほど悪くなく、最高のPDチューン/ミックスには及びませんが、Tofuは他のすべてを上回り、ほとんどのニーズを満たすでしょう。よりスパイシーなものを求めているなら、4th tailをご利用ください。移行はほぼシームレスです。
スタイルは良好で、ポニーベースよりも優れています。TEの破損による問題や衝突もありません。
はい、テキストを生成可能ですが、性能は非常に弱いです。SD3/FLUXと同様、SDXL-baseと同程度です。少なくとも何かしら機能します。
多くのSDXL LoRAと一部のAnimagine/その他のチェックポイントLoRAと互換性がありますが、その効果はさまざまです。ポニー由来のLoRAは基本的に使い物になりませんが、一部のスタイルや概念LoRAは動作する場合があります。最も重要なものとして、SDXLのControlNetは問題なく動作します。Anytest（接尾辞はAM、PDではありません）も良好な結果を出します。

特徴とプロンプトの使い方：

基本：

すべてのSDXLと同様、txt2imgで約1メガピクセル、解像度は64の倍数であれば任意のアスペクト比（1024x1024、1152x、1216x832…）。Euler_aとCFG 4〜9（6〜7が最適）。ハイレゾフィックス：anyGAN/DAT、x1.5–1.6、denoise 0.5、アップスケールは単一タイル解像度が3MPx以下の場合に最も効果的です。ハイレゾフィックスとさらにアップスケールすると、品質・細部・目・手・足などが劇的に向上します。

生成ツールの設定で「Emphasis: No norm」を選択してください。奇妙な塊や歪みが出る場合に有効です。
LCM/PCMアクセラレーターを使用する場合：Euler/Euler aサンプラーを使用してください。DDIMは多くのノイズと異常を生じます。

Clip Skipは一切不要。このミームは忘れてください。

外部のSDXL VAE（例：fp16-fix）をご利用ください。モデルに組み込まれたVAEは古くなっている可能性があります。

品質評価：

masterpiece, best quality

肯定的プロンプトに

low quality, worst quality

否定的プロンプトに。これだけです。

score_x、source_xなどの無意味なラベルは使わないでください。プロンプトに含めると、画像上にそのテキストが表示されるだけです。

否定プロンプト：

(worst quality, low quality:1.1), error, bad hands, watermark, distorted

自分の好みに合わせて調整してください。ただし、なるべくシンプルに保ってください。

グレースケール、モノクロ、黄色背景などのタグを否定プロンプトに含めないでください。これはポニーではなく、過剰に飽和した燃えたような画像しか出ません。

背景を改善したい場合、否定プロンプトに以下を追加：

simple background, blurry background, abstract background

ただし、シンプルな背景を意図したプロンプトの場合は、これを削除することを忘れないでください。

アーティストスタイル：

例示のグリッド

「by」付きで使用。複数指定すると非常に興味深い結果が得られ、プロンプトウェイトで制御可能です。

by ARTISTNAME1, [by ARTISTNAME2, (by ARTISTNAME3:0.8),...]

または

[by ARTISTNAME1|by ARTISTNAME2|by ARTISTNAME3|...]

プロンプトの最初に配置するのが最適です。ワイルドカードとして使用可能。ほとんどの場合、ハイレゾフィックス/アップスケールによって品質と認識度が大幅に向上します。

一般的なスタイル：

2.5d, bold line, smooth shading, flat colors, minimalistic, cgi, digital painting, ink style, oil style, pastel style

組み合わせ可能（アーティストスタイルとも）、ウェイト付きで肯定・否定プロンプトのどちらにも使用できます。今後さらに追加予定。

自然なテキスト：

Booruタグと組み合わせて使用すると非常に効果的です。スタイルや品質タグの記述の後にのみ自然なテキストを使用してください。Booruタグだけを使うのも自由です。

ポニーとは異なり、こちらはより実用的です。現実世界の概念、車、機械、その他の参照も問題なく対応します。しかし、FLUXに近いレベルを期待しないでください。サイズとアーキテクチャが比較になりません。

尾・耳関連の概念：

動作はしますが、理想ほど良くはありません。

tail censor, holding own tail, hugging own tail, holding another's tail, tail grab, tail raised, tail down, ears down, hand on own ear, tail around own leg, tail around penis, tail through clothes, tail under clothes, lifted by tail, tail biting, ...

明るさ・コントラスト：

「暗い夜」「夕暮れ」「明るい太陽」などのタグや自然なテキストで直接プロンプトしても機能します。黒・白背景も動作しますが、必ずしも0,0,0や255,255,255になるとは限りません。ほとんどの場合、これはプロンプトに起因するので、Booru上で該当タグが付いた画像を確認してください。

幸い、（完全な黒背景の前にいるかわいい女の子）などの自然なフレーズを用いることで解決できます。ただし、一般的な使用では問題なく動作し、NAI3と同程度、場合によってはそれ以上に良好です。

知られている問題：

複雑なポーズやシーンで苦戦。より多くの訓練が必要
バイアスが存在する可能性
Cilorankoは実はオポッサムです（選別されたデータセットの誤り）
未発見の問題あり、作業中、非常に実験的、初の試みなど

今後のモデルに対するアーティスト・キャラクターの要望を受け付けています。性能が低く、不正確、または強いウォーターマークが付いているアーティスト・キャラクター・概念を見つけたら、ぜひ報告してください。明示的に追加します。新バージョンをフォローしてください。

フィードバックをお寄せください。非常に価値があり、重要です。

ライセンス：

へへ〜

馬は一切傷ついていないので、オリジナルSDXLと同様です。派生作、商業利用、何でもOK（ただし、元のテキストの制限とあなたの国の法律を守ってください）。ベースモデルの作者を偽称しないでください。非常に識別可能です。

感謝：

アーティストたちは、個人作品の共有のために匿名を希望しています；Soviet Cat – GPU提供；Sv1. – LLMアクセス、キャプション、コード；K. – 訓練コード；Bakariso – データセット、テスト、助言、内部情報；NeuroSenko – 寄付、テスト、コード；dga、Fi.、ello – 寄付；その他協力してくれた仲間たち。大好きです ❤️

もちろん、フィードバックや要望をくれたすべてのみなさんにも感謝します。本当に貴重です。

寄付

AIは私の趣味であり、私は自腹で費やしています。寄付を請うつもりはありません。応援したいなら、私のモデルを広めてください。フィードバックを残してください。ケモミミ娘の可愛い絵を描いてください。そしてもちろん、オリジナルアーティストを応援してください。

しかし、あなたの寄付があれば、さらに多くの訓練と研究を加速できます。

（ただ、アルコールやコスプレの女の子に使ってしまう可能性もあるので、ご了承ください）

BTC: bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c

ETH/USDT(e): 0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db

GPU時間（A100以上）をご提供いただける場合は、DMください。

モデルタイプ	チェックポイント
ベースモデル	SDXL 1.0
公開日	9/10/2024

Tofu [ANIME BASE MODEL]

詳細

ファイルをダウンロード

このバージョンについて

モデル説明