YARI (Yet Another Realistic Illustrious ᵐᵒᵈᵉˡ) | Full fine tune based on WAI-NSFW
詳細
ファイルをダウンロード
モデル説明
これは言うまでもないが、このモデルはDanbooruスタイルのプロンプトが必要だ。これはIllustriousをベースにしているため、Danbooruスタイルのプロンプトを使わなければ、悪質な結果が出る!
v3.0が登場!今回のリリースでは以下の改善が行われました:
- 本リリースはv2.5の詳細度とリアリズムの向上を維持しつつ、v2.0の多様性も保持しています。
v3.0の開発には時間がかかりました。これは、本物のフォトリアリスティックな仕上がりを目指して試行錯誤していたからです。しかし正直、それは可能ではありますが、その結果モデルが極端に硬直してしまいます。つまり、まずキャラクターを正しく再現できなくなるのです。例えば、ナルトのサクラを生成しようとすると、ピンクの髪をした女の子は出ますが、顔はサクラとはまったく似ていません。さらに、プロンプトの忠実度も低下します。これらの症状は、他の比較的フォトリアリスティックなモデル(もちろんIllustriousベースのモデルに限ります)でも見られます。 私は、モデルを可能な限りリアリスティックに保ちつつ、柔軟性も維持することを選びました。そのため、私のモデルはDanbooruで200件以上の投稿があるキャラクターのほとんどを再現でき、複数キャラクターや奇妙なポーズなども柔軟に生成できます。
v3.0をお楽しみください! :)
場合によってキャラクターの似せ方を改善する小さなヒント:
Danbooruでキャラクターのタグが括弧付きで記載されている場合、最初と最後の括弧の前にバックスラッシュを追加してください。たとえば "raven_(dc)" は → "raven_\(dc\)" になります。
このモデルの目的は、すべてのキャラクターをWAI-NSFWに組み込みつつ、よりリアリスティックな外観を実現することです(この素晴らしいモデルの作成者であるWAI0731に完全な謝意を表します)。
!!! 重要なお知らせ !!!
このモデルはファインチューニング版であり、マージ版ではないため、既存のLoRAは動作しません。一部のLoRAが動作する可能性はありますが、ほとんどのLoRAは動作しません。
私がテストし、このモデルと良好に動作することが確認された人気LoRA:
ExpressiveH, Detail Tweaker XL
以下の推奨設定はすべてのバージョンに適用されます。
推奨設定:
ステップ:15–30
CFGスケール:5–7
サンプラー:Euler
オリジナル解像度は1024x1024より大きいサイズを使用してください。
推奨アップスケール設定:
Hiresアップスケール:1.5
Hiresステップ:20
ノイズ除去強度:0.35〜0.5
Hiresアップスケーラー:2xNomosUni_span_multijpg_ldl(複数のアップスケーラーをテストしましたが、このモデルはリアリスティックな画像に非常に良く、高速です)。最高品質を求める場合は、4xRealWebPhoto_v4_drct-lを使用できますが、非常に遅くなる点にご注意ください。
すべてのプレビュー画像にはワークフローが添付されており、解像度を変更するたびに複数のフィールドを手動で変更する必要なく、自動的に1.5倍の解像度を計算します。
すべてのコンポーネント(VAE、テキストエンコーダー、UNet)がチェックポイントに含まれています。
推奨プロンプト:
ポジティブプロンプト
photorealistic, photograph, realistic, masterpiece, best quality, amazing quality, absurdres, detailed_skin
ネガティブプロンプト
bad quality, worst quality, worst detail, sketch, censor, watermark, signature, text, multiple_poses, multiple_scenes, speech_bubble, patreon_username, multiple_images, multiple_angles, bad_hands, wrong_hand, bad_anatomy, extra_fingers, extra_digits
基本的に、WAI-NSFWモデル内のすべてのキャラクターはここで使用できます。利用可能なキャラクター一覧は以下をご覧ください:https://huggingface.co/spaces/flagrantia/character_select_saa
もちろん、完全なファインチューニングの性質上、一部のキャラクターは生成できなくなる可能性がありますが、私が試したすべてのキャラクターは問題なく動作しました。
以前のバージョンの更新ログ:
v2.0が登場!今回のリリースでは以下の改善が行われました:
全ての出力における安定性とプロンプト忠実度が若干向上
学習データ量を約3倍に拡大(v1.0と比較)、結果の多様性が向上
1536pxで学習し、以前のバージョンよりも詳細度が向上
顔の表情が改善されました。以前のバージョンでは、にやりと笑う表情やその他の表情が不気味に見えることが多かったですが、現在はほぼ解消され、すべての表情がより自然に見えるようになりました(悪質な結果が出る可能性はゼロではありませんが、非常に稀になりました)
v1.0が登場!今回のリリースでは顕著な改善が行われました:
全ての出力における安定性とリアリズムの向上
CGI・プラスチックのような外観が低減(まだ発生することはありますが、頻度が減りました)
学習データ量を約2倍に拡大
マルチ解像度学習(v0.1では1024pxのみでしたが、v1.0では1024pxと1280px)



















