Boring Reality

詳細

ファイルをダウンロード

モデル説明

注意:以下を読み、これらのLoRAを使用する際のガイドラインを確認してください。これらを個別に、そのまま使用しても良い結果を得ることはほとんど期待できません。

このモデルは、それぞれ若干異なる挙動を示すが、写実的な結果を実現するために協調して働く複数のLoRAの集合体です。これらのLoRAは、複雑なシーンを維持するために、わずか数枚のポートレート画像のみでトレーニングされるという実験的な手法を利用しています。今後の新バージョンでは、このアプローチに対する理解が深まれば、大きく変更される可能性があります。

現在、以下のような簡単なガイドに従って開始してください:

  • これらのLoRAは非常に少数の顔画像でトレーニングされているため、顔の品質は大きく歪み、同じ特徴が繰り返されることがよくあります(手も同様に劣化します)。顔を修正するために、MagnficAIのような非常に強力なアップスケーラーを使用することを強く推奨します。なぜなら、これによりシーン全体も均一に改善されるからです。ADetailerなどの個別の顔改善ツールを使用すると、シーンのシャープネスが不自然になる可能性があります。

  • これらのLoRAは主にSDXL Baseモデルと組み合わせて使用されます。他のSDXLモデルを使用すると、シーンの複雑さが低下する傾向があります(ただし、顔の品質は少し改善される可能性があります)。

  • 各LoRAバージョンは、やや異なるシーンに最適化されています。最も汎用的な機能を持つのはBoringReality_primaryV3であり、次にBoringReality_primaryV4が続きます。最初は複数のLoRAバージョンを同時に使用し、重みを低めに均等に設定してから、どの組み合わせが最も良い結果をもたらすかを調整することをお勧めします。

  • 現在、負のプロンプトを追加すると、画像が破損する可能性が非常に高いです。また、プロンプトはできるだけ簡潔に保つようにしてください。

  • これらのLoRAからさらに良い結果を得るには、img2imgとDepth ControlNetのアプローチを試すことをお勧めします。Auto1111では、img2imgに「スタイル画像」を設定し、denoise strengthを約0.90に設定できます。「スタイル画像」は、何でも構いません。これにより、生成される画像の色調や照明がそのスタイル画像に近づきます。さらに、好みのポーズやシーンレイアウトを持つ画像(text2imgで生成したものを含む)をコントロール画像として使用し、Depthモデルを適用します。コントロールの強度は、プロンプトにより強く依存させることをお勧めします。

  • 「男」のような単純なプロンプトは、時として奇妙な結果を生む可能性がありますが、逆に長すぎる説明も結果を退屈にすることがあるため、避けましょう。

初期のプロンプトとしては、lora:boringRealism\_primaryV4:0.4lora:boringRealism\_primaryV3:0.4 lora:boringRealism\_facesV4:0.4 から始めて、そこから徐々に調整してみてください。

また、標準的なDPM++ 2M Karras、ステップ数20–25、CFG値約7.0から始めましょう。CFGをさらに高く設定すると、ときにはよりシャープな仕上がりになることがあります。ただし、過度に高くすると、非常に歪む可能性があります。

その他のランダムな情報

これらのLoRAの汎用性を、携帯電話の写真を超えて理解するため、かつて2日間のAI映画コンテスト用に作成したAIビデオをご紹介します。このビデオは、これらのLoRAで生成された画像のみを使用して作成されました。そのスタイル、時代背景、象の存在は、私が元々トレーニングに使用した画像とは一切関係ありません。関係のない奇妙な動きや編集は無視してください。

このモデルで生成された画像

画像が見つかりません。