Head POV - Point of view from the back of the head - Camera over the shoulders - Animal Perspective
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
SDXLでは正しく実現できなかったシンプルなコンセプトです。
推奨ウェイト:0.85/0.6~1.3で良好
人間だけでなく、物体に対してもかなりよく一般化します。お試しください。
トリガーキーワード:
a photo shot in the point of view from the back of a SUBJECT's head
サポートプロンプト:
on the lower side, cropped, looking at___, ears, bokeh, dof, blur
ネガティブサポートプロンプト:
mouth, nose, eyes, facing the camera, bokeh, dof, blur
データセットは小さく、動物と自転車1~2台のみでした。そのため、蛇、ダチョウ、ブタ、カメなどの一部の動物は向きを変えるのが難しい場合があります。
エポック18を選択しましたが、一部の被写体ではより学習したエポック(例:24や40)の方がうまく向きを変えることができました。ただし、それらはより多くのエラーを導入したため、個人的にはエポック18が最良だと考えています。必要であれば、より学習させたエポックをアップロードする可能性もあります。
たとえば、このエポックではピカチュウの頬が常に不自然に見えます。エポック24や40では非常に自然に描写されました。マウスの耳も、このエポックでは逆方向を向いているように見えるものの、エポック40では正しく見えます。
これは「POV」や「オーバーザショルダー撮影」ですが、トレーニングではこれらの単語は使っておらず、「point of view」を使用しました。そのため、これらのキーワードが効果があるかどうかは不明です。
画面全体を占める可能性があります。下部にのみ配置したい場合は、Regional Prompterの使用を推奨します。非常に優れた結果が得られます。また、他のキャラクターロラと併用する場合も、Regional Prompterを使用しないと変形が発生します。
将来的にはデータセットを拡充し、位置(右側、左側、下部、上部)をキャプションで明示したいと考えていますが、現在はそのようにはなっておらず、うまく動作しません。
その他のパラメータと設定:
ベースチェックポイントは「sdXL_v10VAEFix」(6.7GB)です。そのため、あらゆるチェックポイントと非常に高い互換性があります。
現在、インペイントにはjuggernautXL_v8RundiffusionとjuggerxlInpaint_juggerInpaintV8を推奨します。
ライティングモデルは非常に良好です!Dreamshaper SDXLを推奨します。
私は6ステップでDPM++ 2S a Karras、CFG 2.2、ハイレゾは5ステップ、denoising 0.45、解像度1.5倍を使用していますが、デフォルトはDPM++ SDE Karras、CFG 2、4ステップです。
新しいJuggernautライティングもおそらく非常に優れています。
標準生成向け:
CFG:5.5
DPM++ 3M Exponential(50ステップ以上)
DPM++ 2M Karras(25ステップ以上)
DPM++ SDE Karras
DPM++ 2S a Karras
Loractlは、より複雑なプロンプト、被写体、または他のロラを使用する場合に非常に優れています。高い値から始めて、徐々に下げてください。例:
<LoraName:[email protected],[email protected]>
「楽しさ」を味わいたい方は、ワイルドカード動的プロンプト拡張機能https://github.com/adieyal/sd-dynamic-promptsとmy_common_animals.txtを\extensions\sd-dynamic-prompts\wildcardsにインストールしてください。以下は私がテスト用に作成したプロンプトです。プロンプト欄に貼り付けてください:
a photo shot in the point of view from the back of a __common_animals__'s head close-up, on __YetAnotherWildcardCollection-main/Background/Environment__<lora:HeadPOV_from_behind_vk1-000018:0.85>
現在のロラの問題点:
一部の動物は正しく向きを変えられない。より多くのデータが必要。
ときどき二重の角、不自然な耳や目、耳がカメラを向いているような結果が出る。
その他の設定:1024解像度でトレーニング。61枚の画像をCogVLとtaggui-v1.15.0-windowsでキャプション付与。44エポック中の18エポック。現在はProdigy 1.0。2ステップのフォルダー「Pose」をコンセプトとして利用。バッチサイズは常に2、ランクは16/1、スケール重み正規化は1、SNRガンマは5、ノイズオフセットは0.0357、正則化画像は使用していません。
結果とコメントをお気軽に残してください。どんなアイデアも歓迎です。ありがとうございました。




















