Analog Film Photography portraits

詳細

ファイルをダウンロード

モデル説明

アナログフィルムポートレート LoRA

内容: 使い方 - トリガー語 - 学習 - 今後の予定

ポートレート画像の生成において、本物のフィルムのような仕上がりを得るのは非常に困難でした。多くのモデルは色が強調されたり、基本状態で過剰露出されたりするため、私はSD 1.5モデルと連携できるようにLoRAを学習させました。このLoRAは、生成物に一般化されたフィルム特有の雰囲気を加え、フィルムによく見られる繊細なノイズ/グレインを付与でき、さらにフィルム特有の高いダイナミックレンジも再現可能です。以下で、なぜSDを使ってポートレートを作るとしばしば明るすぎたり過剰露出されてしまうかを詳しく説明します。

使い方:

LoRAの強度: 0.3 ~ 0.7 - 強度が高くなるとアーティファクトが出やすくなります。

ポートレート用の任意のリアルなモデル(学習の詳細を参照)と相性が良く、サンプル画像はRealistic Vision V1.4で作成されています。いくつかの他のモデルでもテスト済みで、良好な結果を得ています。やや過学習気味のため、強度を高めることは推奨できません。将来的に修正を試みます。

このLoRAは顔の形、背景、画像全体の雰囲気を変える可能性があり、同じシード値でもまったく異なる結果をもたらすことがあります。これは学習スタイルに起因します。

特定の画像を再生成したい場合は、Control Netや他のツールを強くおすすめします。

特定の人種や外見の人物の画像を生成する際は、記述を具体的に:「ラテン系女性が大きなスウェットシャツを着ている」や「青髪のアジア人男性」などとすることで、似たような顔にならないようにします。そうでないと、類似した顔の人物が生成される可能性があります。

このLoRAは、NSFWの生成にはテストも意図もしていません

トリガー語:

フィルム - アナログフィルム

トリガー語を使わなくても動作しますが、追加のプロンプトを加えることで効果が強まります。また、「 sunset - hard light - soft light」などのプロンプトともよく連携します。

学習:

このLoRAは、さまざまなカラー素材のフィルムで撮影された約30枚のポートレート画像を使用して学習されました。データセットには、多様な人種、性別、年齢層を含み、どのようにモデルや人物に適応できるかをバランスさせる試みをしました。特に顔の再現性に優れていますが、強度を高めると、建物や他の不自然なオブジェクトが違和感のある場所に出現しがちです。これはタグ付け時に怠慢だったためです。将来的に修正を試み、特定の顔の形やオブジェクトに対するバイアスをできるだけ取り除きつつ、優れたポートレートを生成できるようにする予定です。学習ステップが約3500ステップとやや長く、LoRAの強度を下げることで解決可能かもしれません。

LoRA学習について詳しく知りたい方は、以下のチャンネルと動画をご覧ください:

https://www.youtube.com/@Aitrepreneur

今後の予定:

Analog Film Portraits v1.1:より大きなデータセットで、より正確なタグ付けを行い、より穏やかな学習を行う予定。

Neon Lights v1.0:写真家は「ネオン」風の雰囲気を出すために、カラーグェルやカラーライトを使うことがよくあります。しかし、SDはこの点で極めて不向きで、過剰露出したり、勝手にネオンのネックレスや衣装を追加してしまいます。すでにベータ版を学習済みで、非常にうまく効果を再現しています。例画像はこちら:https://unsplash.com/photos/3TLl_97HNJo

Analog Film Landscapes v0.5:ポートレート以外の画像、さまざまなフィルム素材に対してLoRAを学習し、画像生成の柔軟性を向上させます。

Rembrandt Lighting v0.5:SDではプロンプトでの表現が非常に難しく、実際のドラマチックなポートレートに使われる「レンブラント照明」を再現するのは容易ではありません。中程度のデータセットで学習を行い、この有名な照明スタイルの再現を試みます。

Slide Film v0.5:スライドフィルムは明確なカラーのスタイルとグレイン構造を持ち、デジタルで再現するのは常に困難でした。今後、いくつかのLoRAをベータテストしていく予定です。

Street Photography v0.5:広角レンズを多く使い、さまざまな被写体に焦点を当てた写真。これの再現を試みます。

Studio Fashion Photography v0.5:ファッションフォトグラファーは、特定のスタイルやアングル、焦点距離で撮影し、服の質感を強調するためのソフトな照明を使用します。顔に注目するのではなく、服を際立たせるのが目的です。これに合ったさまざまなスタイルで学習を試みます。

なぜこのフィルムLoRAを作成したのか:

SDは膨大な画像データで学習されていますが、「ポートレート写真」というキーワードでLAIONデータベースをざっと確認すると、多くの画像は古いものや低品質であり、過剰露出していることがわかります。また、スタイルに関するタグ付けもほとんど不正確です。同様に「フィルム写真」と検索しても、ロゴやポスターが混在した非常に悪質な例が返ってきます。SDには、特定の写真スタイル、特にプロ級の写真スタイル用の適切なデータセットが不足しているのが現状です。本LoRAは、特定の写真スタイルで高品質な画像を生成できるようにSDを支援するものです。これにより、画像生成に関心を持つフォトグラファーが、自分好みの雰囲気を実現できるようにする目標です。

フィードバックは大歓迎です。何が効果的で、何が不十分だったのかを教えていただけると、今後のLoRA開発に非常に役立ちます。

このモデルで生成された画像

画像が見つかりません。