OddReality

詳細

ファイルをダウンロード

モデル説明

OddReality v2.0

V1は楽しく、若干乱雑な実験だったが、v2はより進化した作品である。私は、OddRealityの欠点を修正し、画像構成、キャラクターの配置と表現力、そして生物の独創性を改善することを目的として、数百年間にわたり高品質な奇妙な画像を慎重に生成し、lycoris/loconを訓練した。バージョン2は、このloconと統合した結果である。

以下は、v2で使用しているパラメータである:

* cfg 6

* 25ステップ

* サンプラ:dpmpp 2m

* スケジューラ:Karras

アップスケール

このモデルの提示に使用された画像の半分は、512x768を「Ultimate SD Upscaler」で832x1248に直接アップスケールしたもの(ノイズ除去率:0.25)。残りの半分は、同じ解像度でhires.fixを適用し、一般的に高いノイズ除去率(多くは0.7)を使って創造的なバリエーションを生成した。OddRealityは細部に強く、アップスケーラーをよく扱う。

これらの画像では、img2img、inpaint、ControlNetなどの他の技法は一切使用していない。Adetailerの顔処理は通常不要である。

ネガティブプロンプト

汎用的なネガティブプロンプトは、OddRealityの特徴を低下させる傾向がある(一貫性を高めるが、奇妙さから離れてしまうため)。

以下は、モデルの欠点とバイアスを補正するためによく使用するネガティブプロンプトであり、構成の質と多様性を損なうことなくレンダリングを改善する効果がある:

"static stick figure, sculpture, figurine, diorama, plaster, conformism, watermark, portrait, childish, out of focus, path, Bollywood, dog, rope, beak, backpack, hour, (blurry:0.5), (snow:0.5), (chiaroscuro:0.5)"

多くのプロンプトでは、「Backlighting」または「chiaroscuro」(または両方)に負の重みを付けることで、黒の過度な強調を補正する必要がある。

また、場合によっては、ネガティブプロンプトなしでOddRealityを使うほうが良いこともある。これはプロンプトに大きく依存する。

バージョン1からの変更点

OddReality 2はよりミニマリスト的である。私はv1のマキシマリズムが好きだったが、あまりにも多くのアーティファクトを生んでいた。レンダリングはクリーンになり、キャラクターはより「普通」に見えるが、要求すれば奇妙になることができる。

OddRealityは奇妙なプロンプトに対する理解が向上した。変則的、不条理、シュルレアリスムに関連するあらゆる要素について、美的品質、一貫性、結果の多様性を向上させるために修正を試みた。私のデータセット内のすべての画像は100%奇妙である。「amorphous creature」と「biomorphic structure」をプロンプトに含めて試してみてほしい。

OddRealityがポートレートを避ける傾向もさらに強化された。このモデルは非常に人間嫌いであり、シーンに登場するキャラクターを描かないこともある。また、キャラクターが服を着ていると明示しなければ、裸体になる傾向がより顕著である。個々の外見はランダムであり、特定の身体的タイプにモデルを誘導しようとしなかった。私のデータセットには、あらゆる年齢・身体的特徴・性別の成人が含まれており、一般的にシーンに配置されたり、環境と相互作用したりしているため、モデルは「キャラクターが何かをしている」というプロンプトにやや敏感になっている。

ComfyUIユーザーへ

OddRealityは低cfg/ステップでも安定して動作するため、リアルタイムワークフローに実用的である。私はキャンバスエディターのノードでcfg 3、ステップ12で使用しており、粗いスケッチをリアルタイムでモデルのスタイルの画像に変換できる。これはポーズや構成の設計に特に有効である。素早くスケッチを描けば、筆塗りごとにほぼ即座の結果を得られる(私のRTX 4070では1秒未満)。得られた画像を潜在変数として使用するか、ControlNetのガイドとして別の画像に利用できる。

例えば、このスクリーンショットでは、プロンプト「amorphous creatures, biomorphic structure, beach, dawn, woman」(前述のネガティブプロンプトを併用)を使用した:

* 左:失敗したスケッチ

* 中央:OddRealityによる解釈(プロンプトとスケッチに基づく)

* 右:スケッチなしでプロンプトのみでOddRealityが生成した画像

以下の画像は、cfg 3、ステップ12、512x512でのOddRealityの標準的な品質を示しており、キャンバスエディターをOddReality用に最適化したComfyUIワークフローを含んでいる。

キャンバスエディターについて:https://github.com/Lerc/canvas_tab

OddReality v1.1

v1.1は明るく、v1の過度に暗い影を修正したものである。一部のプロンプトではやや過剰露出になることがあるため、必要に応じてイエロー、オレンジ、ホワイトに負の重みをかけることがある。

このバージョンはより多様なグリッド、デザイン、キャラクターを生成する傾向がある。男性中心と中年層へのバイアスを軽減した。

また、一部の過激なポルノ的な知識を追加したが、これは結果の奇妙さを高めるためだけである。OddRealityはポルノ用には使いにくく、意図して作られたものでもない。たとえ非常に自然で現実的な肌の女性を生成しても、奇妙な生物やボディーホラーを追加してしまう傾向がある。

「nsfw」と「horror」は、ほとんどのプロンプトで通常の使用に必須である。これらを含めないと、モデルは非常に奇妙な結果を生むことがある。

「path」と「road」に負の重みをつけると、グリッドの多様性が向上し、対称性が減る。モデルは森の中の道を描きたがる傾向がある(プロンプトなしで使用したときの挙動);次のバージョンではこのバイアスをより軽減したい。

OddReality v1

警告

OddRealityは非常に暗く、現実的であり、時として画像に自発的に恐ろしい要素を追加する。これを避けるには、プロンプトにホラーを抑制する重みをつけるか、ボディーホラーを抑制することで裸体も制限する必要がある。キャラクターはデフォルトで服を着ているが、一部のテーマでは裸体になる傾向がある。

現実主義とホラー以外に、このモデルの主な強みは建築、機械、風景である。

設定

サンプラ:DPM++ 2M SDE Heun Karras または DPM++ 2M SDE Karras

サンプリングステップ:25–30

CFG:6–7

解像度:アスペクト比3:4が一般的に理想的。ポートレートには576x768、建築・風景には768x1024を使用しているが、より高い解像度ではより創造的(ただし一貫性が低くなる)な結果になることがある。

Hires.fix:R-ESRGAN 4x+、x1.5–2、6ステップ、ノイズ除去率0.4

プロンプトのヒント

OddRealityは明確な美学を持っており、プロンプトやネガティブプロンプトに通常の品質タグを追加しても、目に見える改善はほとんどなく、創造性や結果の多様性を損なうことが多い。画像に悪いテクスチャや不整合が生じた場合にのみこれらのタグを使用すること。

このモデルはマキシマリスト的で、コントラストが強く、やや乱雑である。シンプルで、精密で、色彩豊かで明るいものを作りたい場合は、以下のネガティブプロンプトを使うとすべてがクリーンになる:

"fucked up horror, messy charcoal drawing, worst quality sculpture"

ネガティブプロンプトに「Backlight」や「Shadows」を追加すると、状況によって有効である。

また、モデルの深すぎる黒を補正するために、プロンプトに光の種類を明示する必要がある場合もある。

モデルのバイアス

- 強い写実主義のバイアス

- 強い近接ショット回避バイアス

- 奇妙さとホラーへのバイアス

- キャラクターは、冬の松林を歩く、太ったひげ面の中年男性(パーカー着用)に偏る傾向がある。OddRealityはかわいらしいものを作ることを嫌う。

比較

以下は、人気のある現実主義モデル(ChilloutMix、Dreamshaper、RealisticVision)との比較バッチである。比較にバイアスをかけないよう、ChatGPTが提供した単語に基づくランダムなプロンプトを使用した。

年齢と性別

男性中心、中年、肥満体型へのわずかなバイアスがあるものの、OddRealityは基本的に要求されたものを生成する。しかし、かわいい女性を求める場合は、やや強制的にプロンプトを調整する必要があることが多い。

コントロールプロンプト

このバッチは主なコントロールプロンプトを示したものだが、他にも多数使用している。

コントロールプロンプトの結果は、画家やイラストレーターが熟知し、芸術学生が最初の授業で学ぶような、画像品質の基本的基準に基づいて評価した:遠くから見たときの構成、形の独創性とダイナミズム、色彩の調和、明暗の質量の分布、表現力。精度は評価基準ではなく、単なる芸術的選択やスクリーン・プリンターの売り文句である。

モデルの起源

主にOddlyTerrifying、RealisticVision、Animergeを混合して設計されたが、その大部分は数十のLoRAを統合し、その多くを減算方式でマージした。主な目的は、現実主義を妨げる要素、およびキャラクターがプロンプトにないにもかかわらず近接ショットやポートレートを強制する要素を排除することであった。

このモデルで生成された画像

画像が見つかりません。