UltraRealistic Lora Project
詳細
ファイルをダウンロード
モデル説明
主な目標は、より「生きた」印象の画像を作り、感情をより豊かにし、ポーズをダイナミックにし、ややアマチュアらしい質感を加えること(ただし、高品質な画像も生成可能)です。
P.S: 皆さんのフィードバック、ありがとうございます!解剖学的な問題について(ここだけでなく)多くのコメントを確認しました。皆様から寄せられた報告や例を収集しています。以下の対応策を検討中です:
フルチェックポイントを訓練する。これは一貫した改善に最も合理的なアプローチかもしれません。
多様なポーズをカバーする写真をデータセットに追加し、解剖学的正確性の向上を図る。
ご意見をいただき、誠にありがとうございます。これにより今後のアップデートをより良い方向に進めることができます。
P.S.2: 訓練は安定した高品質な結果を得るためにRunPodに移行しました。私の作業と今後のアップデートをサポートしていただきたい場合は、Ko-fiで私を見つけられます。私はLoRAだけでなく、モデルのファインチューニングを計画しています。https://ko-fi.com/danrisi
ComfyUIでのFlux用設定:
CFG=1、Guidance=2.5、Scheduler=Beta、Sampler=dpmpp_2m、Steps=40、Strength=0.8~1.0が良好ですが、通常は1を使用しています。ただし手が悪化する場合は0.87に設定します。
ComfyUIでのSD3.5用設定:
CFG=1、Guidance=3.5、Scheduler=sgm_uniform、Sampler=dpmpp_2m、Steps=40、Strength=0.5~1.0が良好ですが、通常は0.7を使用しています。
V2 - Flux
創造物にさらに現実的で多様な表現をもたらし、安定性、解剖学的正確性、全体的な品質において顕著な改善を実現しました。このアップデートによりLoRAがより適応的になり、プロンプト次第で高精細なリアリズムから意図的に低品質な美的感覚まで、さまざまな品質レベルを達成可能になります。
1048枚の画像で訓練されました。
新機能:
安定性の改善:新しいバージョンはより安定しており、テキストプロンプトとの連携が向上し、出力がスムーズで予測可能になりました。
手と解剖学の向上:手と身体の解剖学的表現が洗練され、よりリアルな質感を実現しました。
品質の柔軟性:適切なプロンプトを使用すれば、高品質と意図的な低品質の美的感覚を両方調整可能です(例を掲載中)。
V1.2 for SD3.5 - Large
SD3.5用にほぼ同じ設定でバージョンを作成しました。個人的には良好に見えますが、解剖学的な問題(一部ではFluxよりも悪化している)を確認しました。一方で、美観(色、コントラストなど)はFluxよりもさらに優れています。SD3.5には可能性があると感じており、今後のバージョンもSD3.5で提供する可能性があります。
V1.2
データセットの半分の画像を変更し、プロンプテイングスタイルを変更、手の表現を改善、夜間シーンでの「手電筒効果」を減らし、全体的なLoRA品質を向上させました(hopefully)。このバージョンでは、V1で必要だった多数の「トリガー単語」を用いる必要はありません。トリガー単語で私が挙げたものの中から一部を追加するだけで十分です。
V1
また別のアマチュアLoRAを訓練しました(ここではすでに多数作られています)。
それでも、私のデータセットから2000年代の写真をいくつか採用し、さらに700枚追加しました。現時点では良い結果が得られていますが、品質最適化に関して議論の余地があります。品質をコントロールできると期待していましたが、実際にはモデルを混乱させてしまったようです。データセットには以下のようなさまざまな品質レベルが含まれています:
モバイル端末で撮影された高解像度写真、目立つアーチファクトなし、明確でシャープ
デジタルカメラで撮影された低解像度のアマチュア写真、目立つJPEGアーチファクトなし、わずかにノイズあり
モバイル端末で撮影された中解像度写真、低照度によりわずかにガラス状の粒状性あり、顕著なデジタルアーチファクトなし
その他、これらの組み合わせやバリエーションも多数あります。次バージョンではこれらを削除する予定ですが、現在私が最も効果的だと感じるのは:
低解像度のデジタルカメラによるアマチュア写真、目立つJPEGアーチファクトなし、わずかにノイズあり




















