YARI (Yet Another Realistic Illustrious ᵐᵒᵈᵉˡ) | Full fine tune based on WAI-NSFW

詳細

ファイルをダウンロード

モデル説明

これが言われる必要があるとは思っていませんでしたが、このモデルはDanbooruスタイルのプロンプトが必要です。Illustriousをベースとしているため、Danbooruプロンプトを使用しないと悪い結果になります!

v3.0がついにリリースされました!このバージョンでは以下の改善が行われています:

  • このリリースは、v2.5の詳細性と現実感の向上を維持しつつ、v2.0の多様性を保っています。

v3.0の開発には時間がかかりました。それは、本当に写真のようにリアルなスタイルにしようとして実験していたからです。しかし正直なところ、それは可能ですが、その結果モデルが rigid(硬直)になってしまいます。どういう意味かというと、まずキャラクターの再現が正しくできなくなるのです。たとえば、ナルトのサクラを生成しようとすると、ピンクの髪の女の子は出ますが、顔の作りはサクラとはまったく似ていません。さらに、プロンプトの忠実度も低下します。これらの症状は、他の非常に写真的リアルなモデル(もちろんIllustriousベースのモデルに限ります)でも見られます。

私は、モデルを可能な限り現実的にしながら、柔軟性を保てるようにしました。その結果、私のモデルはDanbooruで200件以上の投稿があるキャラクターのほとんどを再現でき、複数キャラクターや変則的なポーズなどでも柔軟に生成できます。

v3.0をお楽しみください! :)

場合によってキャラクターの似せやすさを改善するための小さなヒント:

Danbooruでキャラクターのタグが括弧付きで記載されている場合、最初と最後の括弧の前にバックスラッシュを追加してください。たとえば "raven_(dc)" → "raven_\(dc\)" となります。


このモデルの目的は、すべてのキャラクターをWAI-NSFWに組み込みつつ、よりリアルな外観を持つことです(この素晴らしいモデルの作成者であるWAI0731に全面的な謝意を表します)。

!!! 重要な注意点 !!!

このモデルはファインチューニング版であるため、既存のLoRAは動作しません。一部のLoRAが動作する可能性はありますが、ほとんどのLoRAは動作しません。

私がテストし、このモデルと良好に動作することを確認した人気LoRA:

ExpressiveH, Detail Tweaker XL

以下の推奨設定はすべてのバージョンに適用されます。

推奨設定:

ステップ:15-30

CFGスケール:5-7

サンプラー:Euler

元の解像度は1024x1024より大きいサイズを使用してください。

推奨アップスケール設定:

Hiresアップスケール:1.5

Hiresステップ:20

デノイジング強度:0.35~0.5

Hiresアップスケーラー:2xNomosUni_span_multijpg_ldl(複数のアップスケーラーをテストしたところ、このモデルはよりリアルな画像に非常に適しており、処理速度も速いです)。

すべてのプレビュー画像にはワークフローが添付されており、解像度を変更するたびに複数のフィールドを手動で変更する必要がなく、自動的に1.5倍の解像度を計算します。

チェックポイントにはすべて(VAE、テキストエンコーダー、UNet)が含まれています。

推奨プロンプト:

ポジティブプロンプト

photorealistic, photograph, realistic, masterpiece, best quality, amazing quality, absurdres, detailed_skin

ネガティブプロンプト

bad quality, worst quality, worst detail, sketch, censor, watermark, signature, text, multiple_poses, multiple_scenes, speech_bubble, patreon_username, multiple_images, multiple_angles, bad_hands, wrong_hand, bad_anatomy, extra_fingers, extra_digits

基本的に、WAI-NSFWモデルに含まれるすべてのキャラクターがこのモデルでも動作します。利用可能なキャラクターの一覧はこちらで確認できます:https://huggingface.co/spaces/flagrantia/character_select_saa

当然、完全なファインチューニングの性質上、一部のキャラクターは生成できなくなる可能性がありますが、私が試したすべてのキャラクターは問題なく動作しました。

旧バージョンの更新ログ:

v2.0がリリースされました!このバージョンでは以下の改善が行われています:

  • すべての出力における安定性とプロンプト忠実度が若干向上

  • 学習データセットを拡張(v1.0と比較して約3倍増加)、結果の多様性向上に寄与

  • 1536pxで学習。以前のバージョンより詳細度が向上

  • 顔の表情が改善。以前のバージョンでは、ニヤリとした笑みや他の表情が不気味に見えることがありましたが、ほぼ修正されました。すべての顔の表情がより自然に見えるようになりました(悪い結果が出ることもまだありますが、以前よりはるかに稀)

v1.0がリリースされました!このバージョンでは大幅な改善が行われています:

  • すべての出力における安定性と現実感の向上

  • CGI・プラスチックのような外観の低減(まだ発生することがありますが、以前よりはるかに稀)

  • 学習データセットを拡張(約2倍増加)

  • 複数解像度での学習(v0.1では1024pxのみ):1024pxおよび1280pxで学習

このモデルで生成された画像

画像が見つかりません。