Head POV - Point of view from the back of the head - Camera over the shoulders - Animal Perspective

SDXLでは正しく実現できなかったシンプルなコンセプトです。

推奨ウェイト：0.85／0.6～1.3で良好

人間だけでなく、物体に対してもかなりよく一般化します。お試しください。

トリガーキーワード：

a photo shot in the point of view from the back of a SUBJECT's head

サポートプロンプト：

on the lower side, cropped, looking at___, ears, bokeh, dof, blur

ネガティブサポートプロンプト：

mouth, nose, eyes, facing the camera, bokeh, dof, blur

データセットは小さく、動物と自転車1～2台のみでした。そのため、蛇、ダチョウ、ブタ、カメなどの一部の動物は向きを変えるのが難しい場合があります。

エポック18を選択しましたが、一部の被写体ではより学習したエポック（例：24や40）の方がうまく向きを変えることができました。ただし、それらはより多くのエラーを導入したため、個人的にはエポック18が最良だと考えています。必要であれば、より学習させたエポックをアップロードする可能性もあります。

たとえば、このエポックではピカチュウの頬が常に不自然に見えます。エポック24や40では非常に自然に描写されました。マウスの耳も、このエポックでは逆方向を向いているように見えるものの、エポック40では正しく見えます。

これは「POV」や「オーバーザショルダー撮影」ですが、トレーニングではこれらの単語は使っておらず、「point of view」を使用しました。そのため、これらのキーワードが効果があるかどうかは不明です。

画面全体を占める可能性があります。下部にのみ配置したい場合は、Regional Prompterの使用を推奨します。非常に優れた結果が得られます。また、他のキャラクターロラと併用する場合も、Regional Prompterを使用しないと変形が発生します。

将来的にはデータセットを拡充し、位置（右側、左側、下部、上部）をキャプションで明示したいと考えていますが、現在はそのようにはなっておらず、うまく動作しません。

その他のパラメータと設定：

ベースチェックポイントは「sdXL_v10VAEFix」（6.7GB）です。そのため、あらゆるチェックポイントと非常に高い互換性があります。

現在、インペイントにはjuggernautXL_v8RundiffusionとjuggerxlInpaint_juggerInpaintV8を推奨します。

ライティングモデルは非常に良好です！Dreamshaper SDXLを推奨します。

私は6ステップでDPM++ 2S a Karras、CFG 2.2、ハイレゾは5ステップ、denoising 0.45、解像度1.5倍を使用していますが、デフォルトはDPM++ SDE Karras、CFG 2、4ステップです。

新しいJuggernautライティングもおそらく非常に優れています。

標準生成向け：

CFG：5.5

DPM++ 3M Exponential（50ステップ以上）

DPM++ 2M Karras（25ステップ以上）

DPM++ SDE Karras

DPM++ 2S a Karras

Loractlは、より複雑なプロンプト、被写体、または他のロラを使用する場合に非常に優れています。高い値から始めて、徐々に下げてください。例：

<LoraName:[email protected],[email protected]>

「楽しさ」を味わいたい方は、ワイルドカード動的プロンプト拡張機能https://github.com/adieyal/sd-dynamic-promptsとmy_common_animals.txtを\extensions\sd-dynamic-prompts\wildcardsにインストールしてください。以下は私がテスト用に作成したプロンプトです。プロンプト欄に貼り付けてください：

a photo shot in the point of view from the back of a __common_animals__'s head close-up, on __YetAnotherWildcardCollection-main/Background/Environment__<lora:HeadPOV_from_behind_vk1-000018:0.85>

現在のロラの問題点：

一部の動物は正しく向きを変えられない。より多くのデータが必要。
ときどき二重の角、不自然な耳や目、耳がカメラを向いているような結果が出る。

その他の設定：1024解像度でトレーニング。61枚の画像をCogVLとtaggui-v1.15.0-windowsでキャプション付与。44エポック中の18エポック。現在はProdigy 1.0。2ステップのフォルダー「Pose」をコンセプトとして利用。バッチサイズは常に2、ランクは16/1、スケール重み正規化は1、SNRガンマは5、ノイズオフセットは0.0357、正則化画像は使用していません。

結果とコメントをお気軽に残してください。どんなアイデアも歓迎です。ありがとうございました。

モデルタイプ	LORA
ベースモデル	SDXL 1.0
公開日	3/2/2024
トレーニングワード	shot in the point of view from the back of a

Head POV - Point of view from the back of the head - Camera over the shoulders - Animal Perspective

詳細

ファイルをダウンロード

このバージョンについて

モデル説明

このモデルで生成された画像