Better Portrait Lighting

詳細

ファイルをダウンロード

モデル説明

より良いポートレートライティング LoRA

内容: 使い方 - トリガー語 - 学習 - 今後の予定

このLoRAには複数のバージョンがあります。V1.0が最も強力であり、それに合わせて調整するべきです。バージョンが低いほど学習ステップ数が少なくなりますが、同様の結果を出します。特にアーティファクトが少なくなる可能性があります。

正直なところ、SDにおける高品質なポートレートライティングはかなり不満が残るレベルです。たとえ2.1でも顔が明るすぎたりぼやけた印象になりがちです。多くのモデルは色が過剰に強調されたり、ベースの設定で撮影が過剰露出される傾向があります。そこで、SD 1.5モデルと連携できるようにLoRAを学習させました。このLoRAは、ポートレート生成に際してはるかに優れたライティングを実現し、よりドラマチックで現実的で洗練された表情を生み出すことが可能です。後述しますが、なぜSDで作成されたポートレートが明るく過剰露出した印象になってしまうのかを説明します。

使い方:

LoRAの強さ:0.5 ~ 0.8 — 強さが高すぎるとアーティファクトが発生する可能性があります。

「ポートレート」用途であれば、どんな写実的なモデルとも安定して連携可能(学習を参照)。サンプル画像はRealistic Vision V1.4 / V2.0で作成。いくつかの他のモデルでもテスト済み、良好な結果を出しています。やや過学習気味なので、強さを高すぎると推奨しません。将来的に修正を試みます。

このLoRAは顔の形や背景、全体の雰囲気を変える可能性があり、同じシードでも結果が大きく異なります。これは学習方法の特性によるものです。

特定の画像を再生成したい場合は、Control Net など他のツールと併用することを強くおすすめします。

特定の人物像を生成する際は、具体的な記述を心がけてください。「ラテン系の女性、大きめのフーディ着用」や「青髪のアジア系男性」といった具合に。そうでなければ似たような顔が生成され続けます。

このLoRAはNSFW生成用途にはテストも対象も含めて一切想定していません

トリガー語:

Dramatic lighting

トリガー語なしでも動作しますが、追加のプロンプトを入れると効果がさらに強まります。また、「Sunset(夕焼け)」「Hard light(硬い光)」「Soft light(柔らかい光)」などと組み合わせても効果的です。

学習について:

このLoRAは、さまざまな写真家のポートレート約50枚を用いて学習しました。訓練データには、多様な人種や性別が含まれており、どんなモデルや人物にも対応できるようにバランスをとろうと試みました。ただし、訓練データのすべての画像が20〜30代の人物のものでした。したがって、高齢者向けのポートレート生成には効果が限定的かもしれません。このLoRAは顔の処理において特に優れており、強さが高い場合、建物や不自然なオブジェクトなどが本来存在しない場所に appearしやすくなります。意図的に過学習をさせ、低い強さでもある程度のコントロールが効くようにしています。

LoRAの学習に関する詳細情報は、以下のチャンネルと動画をご確認ください:

https://www.youtube.com/@Aitrepreneur

今後の予定:

Analog Film Portraits v1.1:より大きなデータセットで学習。タグ付けを改善し、より穏やかな学習を行い、過学習を軽減します。

Neon Lights v1.0:完了済み:/model/14826/analog-film-photography-portraits

Analog Film Landscapes v0.5:非ポートレート画像(さまざまなフィルム素材)を対象に学習させたLoRAを訓練。画像生成時の柔軟性を高めます。

Rembrandt Lighting v0.5:SDではプロンプトだけではこの種のライティングは非常に難しい。中規模のデータセットで学習し、よりドラマチックなポートレートである「レンブラントライト」を再現を目指します。

Slide Film v0.5:スライドフィルムは明確な色調と粒感があり、デジタルで再現するのが長らく困難でした。今後週を重ねてeLoRAのベータテストを実施します。

Street Photography v0.5:広角レンズが多く使われ、多様な被写体を扱うことが多い。これを再現を目指します。

Studio Fashion Photography v0.5:ファッション写真は特定のスタイル・アングル・焦点距離で撮影され、照明もソフト化されており、衣装を前面に出すことに力を入れています。さまざまなスタイルの撮影に取り組み、学習させます。

なぜFilm LoRAなのか:

SDは膨大な量の画像を訓練データとして使用しています。LAIONデータベースで「Portrait photo」を検索すると、ほとんどの画像が古く、品質が低く、また過剰露出していることがわかります。スタイルに関するタグ付けも非常に拙いものが多いです。「Film Photo」で検索しても、ロゴやポスターなどが混じった非常に悪い例が返ってきます。SDには特定の写真スタイル、特にプロフェッショナルなレベルの写真に適したデータセットがほとんど存在しません。そこで、特定のスタイルにおける高品質な写真を生成できるように支援し、画像生成に興味を持つ写真家の方が理想的な見た目を実現できるようサポートを試みています。

フィードバックは大歓迎です。何がうまくいったか、いかなかったかをコメントで教えてください。今後のLoRA学習において、非常に貴重な情報になります。

このモデルで生成された画像

画像が見つかりません。