PhotoSomnia

詳細

ファイルをダウンロード

モデル説明

目を開けたまま夢を見よう

ご快適にPhotoSomniaをお楽しみください。これは、フィルム写真を模倣することを目的として、いろいろと調整・合成された汎用モデルであり、ある程度の成功を収めています。

Q. これって単なるモデルの合成じゃないですか?

A. 結論:いいえ、今日見つかる中で最もリアルな写真描写を再現できるモデルです。

長く書くと:私にとって、モデルの訓練・ファインチューニング、およびそれらのモデル・エンベッディングなどの共有を行う方々こそが、AIアートコミュニティの真の英雄です! ですが、本モデルが優れた写実主義の合成モデルである理由はいくつかあります。まず、これまで試した中で最もプロンプトへの反応が良く、写実的な出力を優先する傾向があります。また、多くのNSFWモデルを含んでいますが、他の写実主義モデルに比べてNSFW出力を生成する傾向は特に強くないため、これはポジティブな点だと考えます。

Q. これはアナログ・ディフュージョン / ドリームライク・フォトリアル / 他のモデルのパクリじゃないですか?

A. これらのモデルをはじめとする多くのモデルが合成プロセスに含まれましたが、私が採用している奇妙で混沌とした合成ワークフローのおかげで、比較的ユニークな出力が得られているようです。特定のモデルがGravy Mixに与えた影響は明確に感じられましたが、この合成モデルはStable Diffusion 1.5以外のモデルの直接派生物とはみなされないはずです。

Q. どのモデルを使いましたか?

A. 実際の人間の写真を訓練データに使ったもの、いくつかの芸術的スタイルのもの、そして高品質な写実主義の合成モデルです。詳細はこの説明文の末尾にリストアップしていますが、お恥ずかしながら一部を見逃している可能性もあり、リスト内の一部を使っていない可能性もあります。しかし、これらのモデルは私のフォルダに存在しており、多くの場合、合成に使われたと考えられます。

Q. どのような比率で合成されていますか?

どの貢献モデルの比率を計算するかは不可能です。Gravy Mix以降、私の一般的なアプローチは、最新の写真用に訓練またはファインチューニングされたモデルを入手し、ワーキング・イン・プログレスモデルと「重み付き和/加算差分」方式で低比率で合成するということです。出力が少し過剰になってきたら、全モデルの重みを一括して減らし、その上でさまざまなモデルを使い、自分の想定する写実主義への方向性に沿って合成を進めていきます。これにより、満足できる結果を得られるまで継続します。

これはA+B比率の合成ほど科学的ではありませんし、ブロックマージのように制御された手法(私は試す時間さえなかった)でもありません。開かれた試行ではありますが、今の段階でこのモデルの結果は視覚的に十分に魅力的だと感じており、コミュニティに共有するにふさわしいと考えます。より強力なシステムで動作するAI補助合成ツールが登場すれば、こうした手法はSDXLが基盤となることですぐに時代遅れになるでしょう。

Q. 出力にぼやけた部分や不自然な部分、偽物のような見え方がある…ква :(

A. 出力のぼやけ具合やその他の特色については、私としては気にしません。これは自分自身のために合成したモデルであり、そのままコミュニティに共有します。もし御自身の求めるスタイルに合わない場合は、ぜひこのモデルをベースにご自身の合成に活かしてみてください。あるいは、御自身の好みのモデルと組み合わせて、構図作成やimg2img、ControlNetなどでご希望の結果を得ることも可能です。

Q. どのような設定やプロンプトを使えばいいですか?

A. デモ画像のメタデータをご参照ください。いくつかの例が記載されています。

Q. このモデルに適用されるライセンスはなんですか?

A. こうしたモデルがなければ、私の活動は成り立たなかったことに感謝し、コミュニティへの贈り物としてこのモデルを公開します。私の理解では、他のモデルを用いてPhotoSomniaを作成していますが、Stable Diffusion 1.5以外のモデルの直接的または証明可能な派生物ではないと判断しています。したがって、Open RAIL-Mが適用されると考えます。下記にリストアップされたモデルの出版元が本ライセンス条項に同意するかどうかは、ユーザーとそれらの出版社との間の問題です。

このモデルを使用してくださる方には、いくばくかの時間と努力を注いだことを鑑みて、転載時のクレジット表記をお願いしたいのですが、必須条件ではありません。

Q. 更新はあるのでしょうか?

A. 最終版は最終版です。これは現時点で利用可能な最高の写実主義モデルの一つですが、私は宣伝が得意ではなく、多くのユーザーに取り上げられていなかったようです。

モデル統合リスト(最新版用に更新済み):

記憶にある限り、この合成の開発過程で使用されたトレーニング/ファインチューニングモデルは以下の通りです:

Absolute Reality
Analog Diffusion
Bigger Girls Photorealism
Brits out for the lads
Cafe-Instagram
Doctor Diffusion
Dreamlike Photoreal v2
Emotion Puppeteer
Elysium_V1
El Zipang
Epic Realism
f222
Humans
Metagod Selfie Mix
NeverEndingDream
NextPhoto
Noise Offset for True Darkness in SD
Parailansfw
Project Photo Beta 2.0 LITE
QGO-10b
RPG v4
sldrRealism
StableGram
Subreddit V3
td-UltraReal
This Babe Doesn't Exist
This Is Real
Vodka
WoopWoop Photo 2.0Alpha
WavyFusion
Z_phyr Mix
Hassan's Blend(直接は使われていないが、多くの他の合成が採用しているため言及が必要)

…そしてもちろん、頻繁に忘れられがちだが常に基本となるStable Diffusion 1.5。

以下は、私が統合したモデルのみ(すべてが高品質な写実主義および/またはその他のスタイルに優れたモデルです):

Analog Madness
Ares Mix
Art & Eros (aEros)
Deliberate v2
HARDblend
Hunter69 v1
I Can't Believe it's Not Photography
kkwIDEAL
MegaMerge v1.1
OpenDream 2.0
Perfection
PhotoMaxUltra v1
Protogen x34
Realistic Vision v1.4
Reliberate
s1dlxbrew
StablyDiffused's Magnum Opus
Sunshine Mix
TheAlly's Mix II: Churned
uber-realistic-porn-merge

このモデルで生成された画像

画像が見つかりません。