Lying reclined

詳細

ファイルをダウンロード

モデル説明

バージョン2.0のアップデート:
画像の明るい部分や暗い部分に時々現れるグリッドパターンが、OneTrainerによるFP4トレーニングに関連していることに気づき、FP8トレーニングに切り替えました。その結果、パターンは消えました。しかし、すべてのLoRAを修正するために、すべてやり直す必要があります。変更したのはタグだけです:現在は<lora:Reclined-step01260:1>です。これは「仰向けに寝て」、肘や背もたれ、クッション、流木などに体を預ける姿勢には依然として機能します。完全に仰向けに平らに寝る姿勢は、別の完全に異なるデータセットを使った別々のLoRAです。


Fluxは、横たわる姿勢を生成するのが特に苦手です。私が得られた唯一の姿勢はうつ伏せで、その場合、足の形状がおかしくなります。最初は一つのLoRAですべてを解決しようと思いましたが、多数のテストの末、それぞれの姿勢を個別のLoRAに分ける必要がありました。例えば、仰向けに平らに寝る姿勢と、リクライニングまたはリクライニングした姿勢を区別するのは困難です——「座っている」ことを指定すると、座っている姿勢が生成され、リクライニングした画像が平らに仰向けの画像に悪影響を及ぼします。

また、<lora:Reclined-80:1>タグを使用しないと、画像に影響を与えるかどうかはほぼ運次第であることに気づきました。トレーニングされた文は「リクライニングした姿勢で」と「彼女は背中に仰向けに寝ており、上半身を肘や…に支えて持ち上げている」です。肘や背もたれ、クッションなど、何かに体を預けることで上半身が持ち上がります。次のLoRAとの違いは、腕がまっすぐになっていない点で、これにより上半身がより高く持ち上がり、座っている姿勢になります。これが「Lean back」LoRAです。このLoRAは、トレーニングステップが非常に少ないですが、自然に少し強く学習されているように見えます。リクライニング部分のキャプションについては広くテストしていませんが、「仰向けに寝て」という表現の方がより安定して機能しているようです。


ここではじめましたが、別々のLoRAに分けて実現する必要があったもう一つの要素は、顔の角度、体の角度、カメラの角度、画像の領域に対するより細かい制御です。しかし、このLoRAから始めて、キャプションは(まだ単独では機能しないものの)準備として一貫性を持たせました。スキームは以下の通りです:

顔の角度:
正面ビュー | 3/4正面ビュー | 2/3正面ビュー | プロファイルビュー

体の角度:
正面ショット | 3/4角度ショット | 側面ショット | 3/4背面ショット

カメラの角度:
高めのカメラ角度 | 目線レベル | 低いカメラ角度 | 肩レベル | カウボーイショット | 地面レベル

画像の領域:
全身ポートレート | 3/4全身ポートレート | 半身ポートレート | 1/4身ポートレート

これがうまく機能するようになると最高です!

このモデルで生成された画像

画像が見つかりません。