4th tail (anime/hentai)
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
あなたの好きな尾~ NAI3のフル体験に備えていますか?(実際にはそれ以上です)
180万枚のアニメ画像データセットを使用したPony Diffusion 6のフルスケール微調整:
オリジナルのPonyや他のモデルには欠けていた(オープンソース界では比類ない)知識
8,000人以上のアーティストスタイル(ワイルドカード)、少数の汎用スタイル
数千のキャラクターを単なるプロンプトで生成可能
どこにもあるようなうっとうしいウォーターマークなし
特異な角度、短縮表現、全身ワイドショット、極端なクローズアップも問題なく、背景も美しい追加ボーナス
最もかわいく愛らしいものから、最も深く暗いファンタジーまで
あなたのキツネ・ネコ・イヌ・ドラゴン…などのワイフ/ハズバンドに最適な尾のコンセプトでの最高のパフォーマンス
この微調整は、基本的なアニメモデルを作るのに十分な学習量を有しています。にもかかわらず、既存のアニメに関する知識は失われず、むしろ向上しました。特にTE(Text Encoder)のトレーニングに対する正確なアプローチと、高品質な自然言語キャプション(約60万件、主にClaude3 Opus/Claude3.5 Sonetで作成)が、プロンプトの制御力と理解力を大幅に向上させました。「新しいベースのように感じられる、Pony(c)ではない」。
そして、多数のPD派生モデルが単なるリスキンやロボトミー化されたマージであるのに対し、このモデルでは1つのLoRAも損なわれず、マージされていません。必要に応じて、独自の調整を追加したり、他のお気に入りのチェックポイントとの差分をマージしたりしても問題なく動作します。これは、優れたPony互換ベースとして機能します。
v0.5.0 チェンジログ
PDベースを用い、新しい前学習・主学習・微調整手法で大規模データセットを用いた新規トレーニング
多数の新規データ追加
トレーニング中に一部の「黒魔術」を施した結果、既存のツールやLoRAとの互換性を保ちながら、完全な黒や完全な白の画像を生成可能に。実際、非常に興味深い実験例です
より優れた安定したベーススタイル、アーティストの「焼き付き」現象の軽減
修正・改善など
(データセットのカットオフ:7月上旬。それ以降のリクエストは保留中ですが、忘れていません)
特徴とプロンプティング:
まず第一に、TEは非常に多くの知識を持っています。あなたがプロンプトした内容を、これまでのように無視することなく、忠実に実行しようとします。ガイドレールも、セーフガードも、ロボトミーもありません。 とにかく、出力してください。
(例:(sunny day, rainbow, ethereal hair, transparent skin, huge breasts:1.9)のようにタグの重みを増やして追加しなければ反応しないような「分裂プロンプト」は機能しません。異常で不気味、あるいは予期せぬ結果が出るでしょう。
一方で、上記のような操作なしに、ブールの画像からタグをそのままコピーしたり、タグと自然言語を組み合わせて普通に記述すれば、非常に広範な結果で優れた出力が得られます。最高の結果を得るには、元のブールタグをそのまま使用してください。最も深く暗いファンタジーは若干の試行錯誤が必要ですが、人気のあるテーマは非常に安定しています。
基本:
すべてのSDXLと同様、txt2imgでは約1メガピクセル、解像度は64の倍数であれば任意のアスペクト比(1024x1024、1152x、1216x832など)。Euler_a、CFG 4~9(6~7が最適)。Highresfix:任意のGAN/DAT、x1.5~1.6、denoise 0.5、アップスケールは単一タイル解像度が3メガピクセル以下で最も効果的。Highresfixおよびさらにアップスケールすることで、品質・細部・目・手・足などが大幅に改善されます。
生成ツールの設定で「Emphasis: No norm」を有効にしてください。奇妙な塊や歪みが発生した場合。
LCM/PCMアクセラレーターを使用する場合:Euler/Euler aサンプラーを使用してください。DDIMは多くの混乱と異常を引き起こします。
LoRAが問題を起こさない限り、Clip Skipは1に設定してください。
品質タグ分類:
4つの品質タグのみを使用:
ポジティブ:
masterpiece, best quality,
ネガティブ:
low quality, worst quality
オリジナルのPonyで使われていたscore_x、source_xなどのタグは使用しないでください。
ほとんどの場合、これらは逆に悪化させ、ノイズや混乱を追加し、体や指を破壊し、スタイルを変更し、尿のような黄緑フィルターを再び引き戻します。
これらは単に悪化させるだけで、ノイズと混乱を追加し、体や指を破壊し、スタイルを変え、尿のような黄緑フィルターを再び引き戻します。
元々、この品質タグの実装は非常に不適切で、トレーニング上の欠陥もあり、膨大なトークンを必要としていました。そのため、オリジナルを修正するよりも、新しいタグを導入する方が良いと判断しました。現在、これらのタグは重大な改善なしに、古いトリガーだけを引きずっているにすぎません。
ネガティブプロンプト:
(worst quality, low quality:1.1), error, bad hands, watermark, distorted
好みに応じて調整してください。
グレースケール、モノクローム、黄色背景などのタグをネガティブプロンプトに含めないでください。それらを含めると、単に焼けた画像が生成されるだけで、色あせた色や「黄色フィルター」を修正する必要はありません。ネガティブに「3D」を含めるのも、ほとんどの場合推奨されません。
背景を改善するには、ネガティブに以下を追加:
simple background, blurry background, abstract background
ただし、シンプルな背景を意図したプロンプトの際は、これを削除することを忘れないでください。
アーティストスタイル:
「by」を使って使用。複数指定すると非常に興味深い結果が得られ、プロンプトの重みで制御可能です。
by ARTISTNAME1, [by ARTISTNAME2, (by ARTISTNAME3:0.8),...]
または/および
[by ARTISTNAME1|by ARTISTNAME2|by ARTISTNAME3|...]
プロンプトの最初に配置するのが最適です。ワイルドカードとしても使用可能(注意:sd-dynamic-prompts拡張機能には、バッチサイズが1を超えると結果が破壊されるバグがあります)。ほとんどの場合、Highresfix/アップスケールで品質が大幅に向上します。
汎用スタイル:
2.5d, bold line, smooth shading, flat colors, minimalistic, cgi, digital painting, ink style, oil style, pastel style
これらは組み合わせて使用可能(アーティストスタイルとも)、重みを付けて、ポジティブ・ネガティブ両方のプロンプトで使用できます。
キャラクター:
ブールと同様、フルネームタグと適切なフォーマットを使用してください。例: "karin_(blue_archive)" → "karin \(blue_archive\)"。より正確な再現のために、肌タグも使用してください。例:"karin \(bunny \(blue_archive\)"。この拡張機能が非常に役立ちます。
多くのキャラクターは名前だけで認識されますが、主要な特徴をプロンプトに加えるとより良い結果になります:
karin \(blue_archive\), karin \(bunny \(blue_archive\), dark-skinned female, purple halo, ponytail, yellow eyes, playboy bunny, fishnet pantyhose, gloves
自然言語:
ブールタグと組み合わせて使用すると非常に優れた結果が得られます。スタイルと品質タグの後に自然言語を記述してください。ブールタグだけでも十分です。すべてはあなたの自由です。
そして、これは依然としてPonyをベースとしているため、現実的な概念、リファレンス、または複雑な表現に関しては、Vanilla SDXLをベースとした他のチェックポイントより劣ります。このようなタスクには、私の新モデルTofuをご覧ください。
尾・耳関連のコンセプトが豊富:
tail censor, holding own tail, hugging own tail, holding another's tail, tail grab, tail raised, tail down, ears down, hand on own ear, tail around own leg, tail around penis, tail through clothes, tail under clothes, lifted by tail, tail biting,...
(ブールの意味、e621ではありません)その他多数の自然言語と組み合わせて使用。一部は完璧に再現され、一部は試行錯誤が必要です。残念ながらv0.5.0では一部のタグの効果が低下しているものの、他のタグは改善されています。また、今やふわふわのケモミミだけではなく、あらゆる種類の尾に対するパフォーマンスが向上しています。
明るさ・コントラスト:
「dark night」「dusk」「bright sun」などのタグや自然言語で直接プロンプトすれば、ほぼ問題なく動作します。黒または白の背景も可能ですが、0,0,0や255,255,255のような完全な色になるとは限りません。これはプロンプトの関係であり、実際にそのタグが付いている画像を確認してください。「かわいい女の子が完全な黒背景の前に立っている」のようなフレーズで解決できます。しかし、通常の使用では問題なく、NAI3と同様、しばしばそれ以上に優れています。
既知の問題
残念ながら、以下のような問題があります:
一部のアーティストスタイルが正しく動作しません。
(理由は明確ではありません。同じデータセットで他のモデルでは問題なく動作するため、PDの1トークンハッシュとの競合、またはオリジナルTEの問題の可能性があります。今後修正される可能性があります。効果が弱いアーティストが見つかった場合は、ご報告ください。)
一部のコンセプトはさらにトレーニングが必要(一部の尾関連、稀な「dogeza」やネットミームなど)
まれにウォーターマークが残ることがあります。主にPonyベース由来ですが、一部はデータセット由来
Cilorankoは実際にはオポッサムです(LMAO、選別データセットの誤り)
未発見の問題あり。現在開発中
今後のモデルへのアーティスト/キャラクターのリクエストを受付中です。パフォーマンスが弱い、不正確、または強いウォーターマークが残っているアーティスト/キャラクター/コンセプトを見つけた場合は、ご報告ください。明示的に追加します。今後のバージョンをお楽しみに。
ライセンス:
Ponyのバイラルライセンスを準拠。オリジナルを確認してください。マージ、微調整など自由に使用できますが、リンクを残してください。
今後の計画:
より大きく、バランスと分類が改善された新データセット(元の2.5倍)は既に準備済みですが、誤りや欠陥は多大なコストを伴います。現在のバージョンの修正はまもなく行う予定ですが、次の大規模トレーニングの前に、さらにフィードバックを収集し、新しい試みをテストします。アドバイスや、自身の経験・ツール・トレーニング方法を共有したい方は、大歓迎です。
データセットに一部のファッリーを追加することを検討中です。解剖学・ポーズ・コンセプトには有益ですが、タグシステムの違いと…広範な美的範囲のため、簡単ではありません。対処法のアイデア、美しい/興味深いファッリーアーティスト、またはデータセットの共有があれば、DMください。
自然言語タグ(ブールタグと組み合わせ)によるトレーニングは、SDXLにも非常に有望です。新しい大規模モデルはこれに対応しています。現状のローカルVLMは十分な性能を持たず、COGやIdefics3は良いですがSFWが強すぎ、joycaptionは幻覚を起こしプロンプト制御がほぼ不可能、Llavaは単に馬鹿げています。他のモデルも同様の問題を抱えています。商用モデルでは、Claudeは非常に高価、Geminiは強い検閲、GPT-4oはこのタスクにはあまりにも馬鹿げています。
したがって、将来的にこのデータセットのSFW/NSFWアニメ画像で微調整されたマルチモーダルLLMが登場する可能性があります。これは非常に役立ちます。Oh、はい、予備版とデモがあります。
Flux:有望で、非常に賢く、GPUを大量に消費し、胸の大きささえも洗脳します。一部のトレーニングでは「アンセンサー」やアニメ概念のわずかな知識が達成されましたが、十分に良くなかったです。興味があればお知らせください。しかし、主な課題はトレーニングツール(現在積極開発中、まもなく完全なT5トレーニングが実現する見込み)と、5~7倍のGPU時間が必要なことです。そのため、しばらく待つのが良いかもしれません。
ご提案・ご要望は、Discordサーバーへどうぞ。
感謝:
匿名を希望するアーティストたちが、プライベート作品を共有してくださいました;Soviet Cat - GPU支援;Sv1. - LLMアクセス、キャプション、コード;K. - トレーニングコード;Bakariso - データセット、テスト、アドバイス、内部情報;NeuroSenko - 寄付、テスト、コード;T.、[] - データセット、テスト、アドバイス;dga、Fi.、ello - 寄付;その他多くの協力者たち。皆を愛しています ❤️。
もちろん、フィードバックやリクエストをくれたすべての皆さんにも感謝します。これは非常に貴重です。
寄付
AIは私の趣味であり、私は自費で費やしており、寄付を乞うつもりはありません。応援したい場合は、私のモデルを共有したり、フィードバックを残したり、ケモミミ少女と可愛い画像を作ってください。そしてもちろん、オリジナルアーティストを支援してください。
ただし、寄付は今後のトレーニングと研究を加速させます。
(ただし、アルコールやコスプレ女子に浪費する可能性もあります)
BTC: bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c
ETH/USDT(e): 0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db
GPU時間(A100+)をご提供いただける場合は、DMください。




















