Willy's Noob Realism

詳細

ファイルをダウンロード

モデル説明

このモデルとそのバージョンは、Noobを基にした安定したリアルさを持つ、いわゆる「出荷時から使える」リアルモデルを最終的に実現するためだけに統合されました。「HD」および「V-Pred」バージョンは、高解像度の生生成とアップスケーリング用に作成されています。

!!! 問題、ノイズの多い画像、またはプロンプトの不具合が発生した場合は、「よくある問題」までスクロールダウンしてください !!!

バージョン情報

V-Pred v2.0 - 新登場!!

これはWillyのNoob Realism V-Predの2回目のバージョンです。

このバージョンは、旧スタイルのモデルと新しいV-Pred v1.0のほぼハイブリッドであり、古いEPSモデルやV-Pred alphaと同様に、暗いシーンと明るい自然光のシーンの両方をサポートします。

モデルの改善を少しずつ続けていますが、モデルの品質を向上させる一方で、特定の領域での知識の大幅な損失や他の重大な問題を引き起こすことが、ますます難しくなっています。

このバージョンでは、clip-Lを置き換え、自分自身および他の特定のLoRAを使用してモデルを調整しました。

このバージョンはCFG 4–9でよく動作します。CFGが低いほど色のバランスが良く、暗いシーンに適しており、CFGが高いほど彩度の高い色や明るいシーンに適しています。

V-Pred v1.0

これはWillyのNoob Realism V-Predの初回リリースバージョンです。

このバージョンは、以前のバージョンとは若干異なるため、いくつかの点で動作が異なります。以前のバージョンと比べてスタイルの損失はわずかにありますが、このバージョンは高解像度のディテールとリアリズムを維持し、何より重要なことに、これまでのすべてのバージョンが苦戦してきた適切な照明を再導入しています。

このV-Predモデルを望む状態にまで仕上げることは、予想以上に困難でした。短時間で終わる作業だと思っていたものが、モデルがほとんど対応できないかのように思えた照明を回復するためだけに、何週間も実験を繰り返す結果となりました。(比較のために言うと、v4からV-Pred alphaへの移行にはたった1日しかかかりませんでした。それ以降が本当の苦労でした。)

その過程で学んだことは、スタイルの問題と照明の問題の両方が同じ重み層に存在しているということです。これは修正を難しくしており、選択肢は、かなり粗いマージを行うか、各層を深く掘り下げて何時間も実験を繰り返すかの二択です。

このバージョンはCFG 5–7でよく動作します。低いCFGは暗いシーンに、高いCFGは明るいシーンや彩度の高い色に適しています。

V-Pred Alpha

V-Pred Alphaは、WillyのNoob Realismで初めてv-pred(v-prediction)ノイズ予測を使用したバージョンです。

このバージョンは、より鮮やかな色と、全体的に暗い・明るい画像を生成できます。

Alphaバージョンであるため、完璧ではありません。EPSの「スポットライト」問題の修正と、暗いシーン用の適切な暗い照明の再トレーニングは、当初予想したよりも大幅に時間がかかりました。そのため、データセットやトレーニング設定をさらに調整し続けるのではなく、初期バージョンをリリースすることにしました。

V-Predモデルは、多くのサンプラーとスケジューラの組み合わせと相性が良くありません。このバージョンでは、うまく動作する組み合わせを見つけるために試行錯誤が必要になる可能性があります。または、v1.0で推奨されているサンプリング設定に戻すのも、完全に問題なく動作します。

HD v4.0

HD v4.0は、WillyのNoob Realismの「HD」シリーズの最新かつ最終バージョンです。このバージョンは、リアリズムをさらに高め、以前失われた知識を強化し、モデルをさらに安定化させるための最終的な試みとして作成されました。

このバージョンは、通常必要な品質やスタイルタグなしでリアリズムを生成でき、ネガティブプロンプトも必要ありません。

今後の方向性:次は、WillyのNoob Realismの本格的なv-predictionバージョンを作成することです。

HD v3.0

このバージョンは、リアリズムをさらに高め、多様性と表現力を向上させるために統合されました。植生とほとんどの背景を修正し、過剰なノイズを制限しました。

このバージョンは、Euler AとBeta、およびDPM++ 2m SDEとKarrasの両方でテストされており、タグベースのプロンプティングと一部の自然言語プロンプティングの両方で動作します。 (タグのみ、またはタグと自然言語の組み合わせで最もよく動作します)

HD v3.0は高解像度での安定性が向上し、1920x1920の生生成は完全に安定し、2048x2048の生生成もプロンプトやアスペクト比によっては最小限~中程度の問題で可能になります。2048x2048で問題のあるプロンプトに対してCFGを上げるとさらに安定性が向上します。(CFGを少し下げることで、高CFGによる過剰な彩度を減らすことができます)

HD v2.0

このバージョンは、リアリズムを高めると同時に、ノイズの多い背景の問題を修正しつつ、複雑なトピックや種族に関する知識を維持することを目的として統合されました。1920x1920までの生画像を最小限の問題で生成可能です。

HD v1と同一のバージョン固有の設定を使用します。

HD v1.0

このバージョンは、リアリズムを高めると同時に、アップスケーリングされた画像と同じ品質で高解像度のベース生成を可能にするために作成されました。768x768から1920x1920までの解像度で、崩れることなく画像を生成可能です。

バージョン固有の設定:

プロンプティングは他のモデルと同様ですが、高解像度画像の最良のディテールを得るには、少なくとも50ステップ以上を推奨します。詳細は「推奨設定」をご参照ください。

意図しない複数のキャラクターが生成された場合は、「solo」タグを必ず含めてください。

長い、より詳細なプロンプトは、より安定かつ詳細な画像を生成します。

このバージョンでは、特定のプロンプトが完全に安定しない可能性があるため、いろいろ試してみてください。

v2.0

このバージョンはv1.0と同じ設定を使用し、リアリズム全体の改善とアップスケーリングのサポート強化を図りました。

v1.0

初期リリースバージョン。

推奨設定:

TL;DR: 通常のNoobプロンプトと同じようにプロンプトを書くだけで、品質タグの後に「realistic」と「photorealism」を追加してください。

Euler AとBetaスケジューラ、またはDPM++ 2m SDEとKarrasスケジューラ(V-Predでは動作しません)をCFG 5–7、ステップ数20–50で使うことをお勧めします。ただし、ご自身で試行錯誤して構いません。すべてのスケジューラや設定がすべてのユーザーに適しているわけではありません。

以下はポジティブプロンプトの例です:

<品質タグ>, realistic, photorealistic, <スタイルタグ>, <キャラクタータグ>, <ポーズタグ>, <背景タグ>  

以下は具体的な例です:

masterpiece, best quality, highres, absurdres, (realistic, photorealistic), 1girl, solo, anthro, wolf, grey fur, posing, bedroom

以下は私が推奨するネガティブプロンプトです:

(高品質画像を得るには、もはやネガティブプロンプトは不要です)

worst quality, low quality, normal quality, monochrome, bad anatomy, ugly, (illustration, cartoon, anime), flat color, outline, smooth skin, blurry,

これらは私の個人的な推奨です。ご自身で試行錯誤し、ご自身に合った設定をお使いください!

よくある問題:

私の推奨設定は絶対的ではなく、ComfyUIでモデルをテスト・使用して得た私の個人的な好みです。

性別を明示しない場合、モデルは女性キャラクターや胸のあるキャラクターを自動生成します(女性へのバイアスのため)。

「1girl」タグは、現実的な人間を生成しようとすると、特定のプロンプトで問題を引き起こすことがあります。奇妙な出力が得られた場合は、「female」タグだけを使用してみてください。

不要な複数キャラクターが生成された場合は、「solo」タグを必ず含めてください。

ForgeではBetaスケジューラが正しく実装されていないため、深刻なアーティファクトとノイズの多い画像が生成されます。
Forgeで動作するスケジューラのリストはこちら:https://civitai.com/posts/11756794

私のテストでは、ReforgeではBetaスケジューラは動作しますが、一部のユーザーが問題を報告しています。Reforgeが最新版であることを確認してから、私に不具合を報告してください。それ以外のほとんどのサンプラーはReforgeで完全に動作します。

Reforgeで動作するスケジューラのリストはこちら:https://civitai.com/posts/11756585

A1111を使用しているユーザーからは、実際に問題の報告はありません。A1111で問題が発生した場合は、設定を確認することをお勧めします。

A1111で動作するスケジューラのリストはこちら:https://civitai.com/posts/11757173

一部のユーザーは、Reforgeを使用中に小さなVAEアーティファクトを経験しています。これはVAE設定が正しくないことが原因と考えられます。このモデルはデフォルトのsdxl.vae.safetensors SDXL VAEを使用しています。

一部のEPS LoRAは、このモデルのV-PREDバージョンに問題を引き起こす可能性があります。たとえばEPSの「スポットライト」効果により、夜間・暗い照明が明るくなり、色の彩度が低下することがあります。

その他の情報:

このモデルはフューリーを念頭に置いて統合されましたが、あらゆるリアルな人間や人型ファンタジー種族の生成が完全に可能です。さまざまなユニークなフューリー種族、人型ファンタジー生物、人間のすべてに対して広くテストしました。また、SDXL、PDXL、IL、Noob LoRAとの互換性もテストしました。適切なタグでトレーニングされたほとんどのLoRAはこのモデルで動作しますが、Noob LoRAが最もよく動作します(この統合モデルのベースがNoobだからです)。他のSDXLベースモデルLoRAは、成功度が異なる可能性があります。

「偽スライダー」Pony LoRAは動作しません。これらはPonyの品質タグで活性化されるようにトレーニングされているためです(非常に少ないですが、注意してください)。

今後、新たなリソースが公開されたり、私が時間的余裕があれば、より良いバージョンを作成する予定です。リアリズムやその他のLoRAを追加し、モデルをさらに強化します。

問題、フィードバック、提案がございましたら、コメント欄でお知らせください!

このモデルで生成された画像

画像が見つかりません。