Eldritch Photography | for Flux.1 dev

詳細

ファイルをダウンロード

モデル説明

劇的な光、リアリスティックなテクスチャ、ロマンチックな色調、長い被写界深度の写真
バージョン 2.0 - シンプルなプロンプトでより一貫した結果を実現
上記は、LoRAを使用した場合と使用しない場合のタイガーの同じプロンプト/設定で生成された画像です。その他の比較画像は、Imgurのこの長尺画像をご確認ください。

多くのモデルがFluxで背景を描画する方法を確立しましたが、ほとんどがアナログやスナップショット風の写真で学習しています。このモデルは、最大限のドラマティックでシネマティックなスタイルを保ちながら、背景を提供することを目指しています。

当初、このモデルの内部空間の改善を試みましたが、結果として全体的に向上したモデルを得ることができました。特に注目すべきは、目標の美的スタイルを最小限のプロンプトで一貫して得られることです。 以前は、背景を詳細に描くために複雑な説明を書く必要がありました。しかし、このモデルは「ああ、そういうことか!」という気づきをもたらし、その本質的な目的を理解しました:常に詳細な背景を提供することです。

写真的なシーンのプロンプトを書く際、背景の詳細さに過度にこだわらず、結果をお楽しみください。

いつものように、さらに改善できる点についてのご意見をぜひお聞かせください。


以前のバージョンへの注意点:

Forgeでは、「FP16 LoRAモード」を有効にしてください。

プロンプトに「Photography(写真)」という言葉を使ってください: このモデルは、「写真」の強調が不十分だと、非常に美しいイラストを生成しがちです。必ず写真を意図して明確にプロンプトを書いてください。ファンタジーやSFのシーンでは、プロンプトの最初と最後に写真関連の言葉を配置しています。

長めの被写界深度(背景も鮮明)が欲しい場合: 背景を記述してください。その奥に何があるのか、独自の特徴をいくつか書きましょう。より背景に焦点が当たります。

Fluxの他の多くのアプローチとは異なり、これによりシネマティックまたはプロフェッショナルな写真スタイルを放棄する必要はありません。壮大で、かつ長めの被写界深度を両立させることができます。スナップショットやアナログ風の画像を生成したい場合は、それ専用のLoRAを使う方がより適しています。

背景をぼかしたい場合: 前景の被写体を記述し、背景についてはできるだけ簡潔かつ一般的に言及してください。これにより、主に被写体に焦点が当たり、背景は自然にぼけます。あるいは、このLoRAの強度を下げたり、使用しないのもありです(笑)。被写界深度以外の面でも効果があるため、写真用プロンプトではデフォルトで使用しています。

最初、私はSDXLモデルで使用された同じデータセット、Eldritch Candid PhotographyでFluxを学習させましたが、まったく満足のいく結果が得られませんでした。そこで、データセットを大幅に変更し、ノイズテクスチャを大幅に減らし、色調とトーンの調整を行いました。その結果、非常に優れたベータ版モデルが得られました。

しかし、このモデルに適用したトーンとグレインは、インスピレーション源となったXLモデルほど十分な効果を発揮していないと感じました。そのため、同じデータセット(非常に長い被写界深度の画像)をそのまま処理せずに新たなモデルを学習しました。このモデル単独では、出力画像がやや厳しく冷たい印象でした。そこで、このモデルとベータ版をマージし、非常に良いv1.0が完成しました。

しかし、これでもまだ理想に届かず、他のいくつかのアプローチやマージ方法を試した末、データセットに単純なカーブ調整を加えてコントラストを強調し、全画像に一貫した劇的な照明を実現することに決めました。この調整だけでも、最終目標にかなり近づいていました!その後、さまざまなモデルとのシンプルなマージを試し、最終的にv1.2に落ち着きました。これはFlux向けのこのモデルの最終形態になると予想しています。

このモデルで生成された画像

画像が見つかりません。