NEW ERA (New Esthetic Retro Anime)

詳細

ファイルをダウンロード

モデル説明

90年代・80年代と現在の00年代を組み合わせたモデル

私はPATREONを復元しました(あるいは、Patreonの許可を得て新しいものを作成しました)。もし誰かが支援してくださりたいなら、BOOSTYで有料だった私のすべての新しいモデルとLoRAを1つのアーカイブにまとめ、そこへ投稿しました。無料でさえPATREONにサブスクライブしてくださると、私の作業を気にしてくださり、更新を楽しみにしてくれていることがわかり、とても嬉しいです。

v5.0について:

最新のLoRAに比べて、品質が劇的に向上したNAI-XLを基にこのモデルを実装することに決定しました。モデルは微調整が容易なため、環境の詳細化、目、解剖学的正確さ、指、衣装の多様性が改善され、重要なことにコントラストが低減されました。v3.0ではコントラストが非常に高く、追加のLoRAを使うのが難しかったため、CFGスケールを2.5に設定する必要がありましたが、現在は同じコントラストでCFGスケールが約4となり、追加LoRAの使用に十分な余裕が生まれました。

Latent(nearest-exact)スケーリングを使用すると、アーティファクトが大幅に減少します(時には全く見られません)。これは品質と解剖学的正確性の大幅な向上を示しており、スケーリング中に解剖学的構造がより正確な範囲内で維持されるようになっています。

ワークフロー(設定をそのままコピーしてください。否定プロンプト以外すべて。最適な設定は以下に記載):

画像へのリンク

v6.3および6.69について:
最終的には、このモデルを改良するために微調整とLoRAのトレーニングを再実施したため、少し時間がかかりました(また、Pythonを再インストールした後、私のすべてのWebUIが壊れてしまい、それをすべて修正する必要がありました)。

すぐに言及しますが、このモデルはepsilonではなく、v-pred(速度予測)に基づいています。v-predとepsilon(ε予測)は、拡散モデルにおけるノイズのパラメータ化に用いられる異なる数学的アプローチです。詳細は割愛しますが、アニメに対して正しい設定を用いれば、vpredのほうが優れています。ただし、vpredは画像の焼き付き(frying)に対して大きな問題があり、SNRがゼロのときの収束性がやや劣ります(vpredはSNR=0で使用すべきです)。私はvパラメータ化の適切な設定により、強いコントラストと色落ちの問題を解決し、SNRを完全に無効化し、SDXLで使用される固定値ではなくノイズを自動調整するなどを行いました。インターネット上には実際のデータがほぼ存在しなかったため、試行錯誤とvpredに関する科学論文の丁寧な読み込みを通じて、いくつかの微妙な点を理解することができました。実際、Civitai上のオリジナルのNOOBAIは誤ったトレーニングが施されており、セットアップとトレーニングに協力してくれた多くの人々の存在を考えると、かなり面白いことです。

実際、v-predは非常に繊細で完璧ではありません。今後ハイブリッドアプローチの発展により、現在の制限が解消されることを期待していますが、そのためには拡散モデルのアーキテクチャ自体に根本的な変更が必要になるでしょう。

モデルに戻りますが、なぜ2つのバージョンがあるのでしょうか?私は顔と目の詳細に若干の劣化(それほど大きくはありませんが、重要な点)を認識したため、v6.69を新たに作成し、最初から顔の改善に特化したLoRAをトレーニングし、解剖学的な調整をさらに進めることにしました。その結果、解剖学的精度は新たなレベルに達しました。一方で、v6.3は70〜75%のケースで、影の表現が視覚的に約5%優れていることがわかりました。これは多くの人にとってはそれほど重要ではありませんが、私にとっては重要なので、両方をご提供します。v6.69は解剖学的に優れ、v6.3は影の表現がわずかに優れています。(まずv6.3を掲載します)

バージョンとv5.0の比較(すべてのアートは拡大処理なしで1024x1056解像度で作成):
サンプラーの比較:

[

](https://boosty.to/girlsai/posts/49b336b1-136e-40a6-9dbc-4c11dd659767/media/e4c661d4-572e-4364-8dad-873ba7ba4b1c?from=blog_post)**このモデルが極限解像度での解剖学的整合性を、古いモデルと比較してどの程度うまく扱っているかについて話しましょう。私は、**キャプションドロップアウト率とネットワークドロップアウト率を0.05に設定**することで、整合性を数倍向上させました。**解像度1400x2000**(この結果にもかかわらず、この解像度は極めて極端であり、推奨されません。Latent(nearest-exact)アップスケーリングを使用することをお勧めします)

私のワークフロー
プロンプトの先頭:masterpiece, best quality, newest, official art, absurdres, highres

否定プロンプト:worst quality, low quality, (censored, bar censor, mosaic censoring, 4koma), multiple views, blurry, artistic error, bad anatomy, bad feet, wrong foot, bad hands, bad proportions, bad perspective, bad leg, bad arm, bad neck, bad vulva, bad reflection, bad ass, bad face, english text, chinese text, watermark, simple background

否定プロンプトは標準的で、danbooruサイトのすべての不良解剖学的タグを使用していますが、一つだけ例外があります—simple background。vpredモデルは非常に単純化されがちであることを発見したため、この否定プロンプトは全体的な細部を改善するのに役立ちます。

RescaleCFGはもはや不要です。今やcomfiforgereforge、そして標準的なautomatic1111でも安心してご利用いただけます。

vpredモデルは詳細な記述を非常に好みます。danboorubooruタグを使用してください。"1girls"でも動作しますが、画像は可能な限り単純化・標準化されます。これはこれらのモデルでは避けられない現象です。epsilonモデルはこの点で多様性がありますが、それ以外のすべての点で劣ります(まったく劣ります)。

まだインストールしていない場合は、"sd-webui-tagcomplete"拡張機能をインストールしてください。この拡張機能は、アニメスタイルのイラストを主に閲覧するために使用されるDanbooruなどの「image booru」ボードで認識されるタグのオートコンプリートヒントを表示します。

CFG Scale:任意です。過度なコントラストの問題は解消されました。5〜7(標準値)を設定できます。

あ、そういえば、80年代・90年代・00年代のスタジオジブリアニメからかなりのフルHD画像を追加しました。これにより、このスタジオのスタイルでアートを生成できるようになりました。ワイドスクリーン画像も、より優れた解剖学的表現で作成可能になりました。

追加されたアニメ:

hotaru no haka

tonari no totoro

sen to chihiro no kamikakushi

howl no ugoku shiro

tenkuu no shiro laputa

NEW_ERA_v7.1 (NAI V-PRED) または PATREON(レトロアートの新段階。v6.3およびv6.69よりはるかに優れており、安定性・美しさ・実装のしやすさが向上)

NEW ERA 4.0 (ILLUSTRIOUS-XL) / SDXL / LORA

NEW ERA v1.0(SDXL / PONY DIFFUSION版。私の人気モデルをほぼすべて統合し、レトロアニメに重点を置いたバージョン)

P.P.S. ニューモデルAnime Screencap / LORA / PONY DIFFUSIONBoostyで公開されています!

私が動画 を作成しました。同じ品質を実現する方法、または私のアートを再現する方法を示しています。

完璧な否定プロンプト(danbooruのすべての悪いプロンプトをそのまま使用):

否定プロンプト:worst quality, low quality, (censored, bar censor, mosaic censoring, 4koma), multiple views, blurry, artistic error, bad anatomy, bad feet, wrong foot, bad hands, bad proportions, bad perspective, bad leg, bad arm, bad neck, bad vulva, bad reflection, bad ass, bad face, english text, chinese text, watermark, simple background

レトロアートスタイル — 主要なレトロトークン。ほぼすべてのトレーニング画像に含まれており、80〜90年代で異なる結果をもたらします。

1990s \(style\) — モデルのスタイルを劇的に変える非常に強力なマーカー

1980年代 \(スタイル\) - 最終的な結果に大きな影響を与えた

2000年代 \(スタイル\) - 以前よりもはるかに良い

アニメスクリーンショット、アニメ色付け - 2つの強力なトークン、非常に効果的で、画像をアニメのスクリーンショットのように見せます。改善のために一緒に使用しても、別々に使用しても問題ありません

写真の背景 - 環境を現実的にし、キャラクターはアニメスタイルのままにします(このモデル用に調整済み)

ヒントの最初には必ず「masterpiece, best quality」と記入してください。

アーティスト:

by urushihara satoshi

by danmakuman

by kitazume hiroyuki

by kawarajima kou

by kotobuki tsukasa

by hirano toshihiro

新規追加:

by mikimoto haruhiko

by kajishima masaki

by saotome nanda

by hakumai gen

P.S. 7.9V(1.5を基にしています)

Civitaiの生成サービスで使用する場合 - チェックボックスがオンになっていますが、なぜか機能しません

reForgeでコントラストを低下させるには RescaleCFG を使用できます

コメント有無にかかわらず、ご自身の作品を投稿してください。改善の助けになります。ありがとうございます!

私の作品をお気に入りなら、上のハートをクリックしてください。喜びます :3

このモデルで生成された画像

画像が見つかりません。