BoltMonkey-PhotoReal
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
BoltMonkey-PhotoReal
これは、私の余暇中に取り組んでいるビジネスプロジェクトの派生として作成した、非常に高品質な写実的なSD1.5モデルです。私はAIのオープンソース性を信じており、現在のプロジェクトで使用しない一部の成果物を段階的に公開しています。このモデルの開発は約1年間にわたりゆっくりと進めてきました。
私はこのモデルを「マージ」とラベル付けしていますが、すでに30回以上にわたる反復を経ており、その中には多数のブロックマージや複数のファインチューニングが含まれています。
このモデルは、SD1.5としては非常に写実的です。
手は一般的に5本指で、ひどく変形することはありませんが、過度に複雑なプロンプトや不適切な表現スタイルでは切断や歪みが生じることがあります。
ほとんどのテクスチャはよくレンダリングされていますが、非常に埃っぽい環境(例:鉱山のトンネル内)は、私の好みではやや汎用的すぎるように感じられます。
照明と影はこのモデルの強みです。特に、霧や埃を含んだ大気を通過する光の筋(ボリュメトリックライティング)は、非常に良く再現されています。
私のショーケースでは主に動物を使用していますが、このモデルは人間、建築物、自然環境、食べ物なども優れた生成能力を持っています。ただし、私はほとんどの交通機関について十分にトレーニングしていないと感じています。
使用の提案
私はCivitAIのユーザー層からプロンプティングについて学ぶべき点がたくさんありますが、以下に私が効果的だと発見したいくつかのポイントを紹介します:
_TL;DR:
DDIM、15-40ステップ、CFG ~2-10、Clipskip 1-4(用途によります)、LoRAはうまく機能します。_
このモデルは正方形と長方形のアスペクト比でよく動作します。解像度768x以上が最適ですが、1024x付近ではまれに重複が発生することがあります。ただし、512x以上でも十分に高品質な画像が生成されます。
このモデルの出力品質は、最小限のプロンプトでも非常に写実的ですが、構造の整ったプロンプトでは特に卓越した結果を示します。また、LoRAと非常に相性がよく、LoRAのトレーニング解像度(768+が最適)に注意すれば効果的に使用できます。私はアニメ風LoRAは使用していないため、その点についての提案はできませんが、試していただいた結果に興味があります。
非常にシンプルなプロンプト(例: "cat")でも高品質な写実画像が得られますが、このモデルは的確なガイドプロンプトややや複雑なプロンプトにも優れた反応を示します。
私がよく使用するプロンプトは以下の通りです:
"ultrarealistic photography, 32k UHD, absurdres, natural light and shadows, volumetric lighting, natural skin textures, accurate attention to details, depth of field, sharp focus"
通常、私はサンプラーとしてDPM++_3m_SDE_GPUとSGM_uniformノイズスケジュールを使用しますが、このモデルは私の好みではDDIMサンプラーとDDIM_uniformノイズスケジュールで最も優れた結果を生み出します。
15ステップで十分な画像が得られますが、通常は25-40ステップを使用しています。ComfyUIの最大999ステップで生成を試したこともありますが、結果は明らかに素晴らしいものの、50ステップを超えてまで使用する必要性は感じていません。
CFG値を具体的に示すのは難しいです。CFG 2-4で十分に機能しますが、生成内容によっては10まで上げることもあります。最初はCFG 4から始め、自身で調整することをお勧めします。もちろん、低い値はモデルにより多くの自由度を与えます。
このモデルはClipskipなしでも動作しますが、複数の異なる概念を1つの画像にマージする際には、2〜3ステップClipskipを適用することで概念の流れを滑らかにする効果があります。
このモデルの構成に貢献した可能性のあるモデル
Juggernaut
LeoSam FilmGirl Ultra
Realia Photorealistic
MNK Realism
Analog Madness
Photon
EpicPhotogasm
前述したように、私はこれまで約1年間、段階的にこのモデルを開発してきました。ブロック単位での混合と中間的なファインチューニングを繰り返してきたため、現在の状態では、含まれる個々のモデルの影響は非常に薄くなっています。



















