NextPhoto

詳細

ファイルをダウンロード

モデル説明

注意: このモデルには独自のVAEが組み込まれています。最良の結果を得るため、automatic1111で選択されているVAEを「自動」に設定してください。VAE設定を触ったことのない場合は、これがデフォルトになります。

NextPhotoは、膨大なトレーニング、データの選別、ブロックのマージを経て作成されたモデルです。このモデルは写真のようにリアルな写真の生成に特化しており、非写真的な画像の生成はできません(意図的にpromptで指定しても同様です)。バージョン3.0の詳細については、「このバージョンについて」を参照してください。

すべてのサンプル画像は、ESRGAN_4xアップスケーリングモデルを2倍にアップスケールし、ノイズ除去強度0.45で生成されています。v3モデルは16bit精度でトレーニングされているため、32bitモデルをアップロードする必要は全くありません。実際、それはただのスペースの無駄になります。

使用ガイド

  • (強く推奨) フォトリアルな質感を得るため、ネガティブプロンプトは非常に重要ですが、変更しなくても非常に良い結果が得られます。以下をベースとするのをおすすめします:(worst quality:0.8), カートゥン, 半調律印刷, バルパップ, (cinematic:1.2), (verybadimagenegative_v1.3:0.3), (サルレアリスム:0.8), (モダニズム:0.8), (アール・デコ:0.8), (アール・ヌーヴォー:0.8)

    • このプロンプトでは、verybadimagenegative_v1.3のテキスト埋め込みを使用しています。手に入れることをおすすめします。

    • ダウンロードしたファイルをSD WebUIのルートディレクトリの「embeddings」フォルダに入れて、Stable Diffusionを再起動してください。

  • ポジティブプロンプト: ポジティブプロンプトに関する深く考える必要はほとんどありません。このモデルはシンプルなポジティブプロンプトでも非常に良い結果を出します。

    • 例:

      • 駅での女性の明るく照らされた写真

      • 過去の夫婦がPorchに座っている、完璧に明るく照らされた中型の写真

      • 夜の小道を歩いている男性の暗い照明の写真

    • その他にもポジティブプロンプトの例は、モデルのサンプル画像を参照してください。

  • アップスケーリング: このモデルはアップスケーリングなしでもフォトリアルな画像を生成できますが、フォトリアルな質感を得るためにはアップスケーリングが強く推奨されます。不十分な結果を得ないためには、ハイレゾ修正(hires fix)でESRGAN_4x(R-ESRGANではない)を使用する必要があります。weightは0.3〜0.5の範囲で設定すると最良の結果が得られます。アップスケール量は2に設定してください。通常私はweightを0.5または0.45に設定しています。

  • サンプラー: 私はDPM++ 2M Karasを使用しており、他に変えることはほとんどありません。他のサンプラーも良い結果が得られますが、このモデルではDPM++ 2M Karasが最も安定した結果を出せると言えます。

  • さらに改善を図るため:

    • CFGスケールを低くする: デフォルトの分類器フリー指導スケール7は十分に効果的ですが、時折これよりも高すぎることがあります。目的の結果が得られるまでCFGスケールを下げてください。一般的に4.0で最低限まで下がります。それ以下にするとネガティブプロンプトが無視されるようになります。CFGスケールを7または8以上に上げると、より「ドラマチック」な(良い意味ではない)画像になりますが、プロンプトへの反応が高まります。そのため、状況に応じてバランスをとるようにしてください。高CFGスケールは特定の状況ではうまく働く場合がありますが、低CFGスケールの方が比較的安定して良い結果を得られます。

    • 過度なLORAおよびテキストインバージョンの使用を避ける: v2およびv3のこのモデルは、単純なブロックマージだけではなく、カスタムトレーニングされているため、他のモデルと比べてLORAやテキストインバージョンの効果が薄くなる可能性があります。私の経験では、それでも良い結果が得られますが、慎重に使用することをおすすめします。必要なときだけ選択的にLORAやインバージョンを加える「追加的アプローチ」が適しています。

このモデルで生成された画像

画像が見つかりません。