Racing Women
詳細
ファイルをダウンロード
モデル説明
私は、魅力的なレーシングスーツを着た女性の画像を生成するのに役立つことを期待してこのLoRAを作成しました。特定の実在のスタイルをターゲットにしているわけではなく、やや官能的な含意を含ませることを意図しています。
私の元画像は、XL、Z-Image、さらにはQwen Image Edit 2511で生成しましたが、私はこのジャンルに特に興味があるわけではなく、顔が実際の人物とどれほど一致しているかはよくわかりません。個人的には気にならないのですが、関連する衣装が持つ可能性には興味があります。このLoRAを作成するにあたり、実在の人物との類似性を避けることが私の目的です。
実際の画像は使用していませんが、すべての顔を白で覆い隠し、システムの指示なしにその状態からLoRAを作成したところ、推論時に顔のない女性の画像が主に生成されました。
衣装のさまざまな詳細や色をプロンプトとして入力し、考えられる限りのポーズ——座っている、傾いている、またはただ立っている——をすべて上向きに想定しました。
その中から、ほとんどの画像の背景を除去し、それぞれに異なるサイズの白背景を追加しました。その後、どのような変更を加えることで衣装、ポーズ、環境の特定のスタイルへとトレーニングを導けるかを検討しました。
その後、最終的なデータセット用にqwen-image-edit-2511を使って新しい画像セットをプロンプトし、顔の修復と私が望む詳細を追加できるようにしました。
しかし、数百枚の画像の半分ほど進んだところで、Flux Kleinがリリースされ、ベース版と4ステップ版の両方で徹底的にテストした結果、非量子化された4ステップ版を選び、6ステップまで押し上げました。このモデルとワークフローを使ってデータセットを完成させました。なぜなら、この方法で十分な品質のソース素材を非常に迅速に生成できたからです。
結果をざっと確認し、不具合や不整合がないかチェックした後、必要に応じて一部の画像を再処理して、以前思いつかなかった要素を追加しました。そして、私の目的に合致する50枚を選択しました。
これが私がトレーニングに使用したデータセットであり、多くのハイパーパラメータをいじることはしませんでした。ただ、ランドスケープ画像の品質向上のために512と768の次元を追加し、ステップ数を20,000に上げました。所要時間は約3時間でした。
パイプラインのどの段階においても、データセットにはヌードや性的な状況は一切含まれていません。
私はほとんどのLoRAの説明にこれほど詳細を書きませんが、このようなものをいくつか作ることで、他の人が私の手法を試して、自分にも適用できるかどうかを確認できるようにしたいと思っています。あなたが上記のステップを活用したかどうかにかかわらず、あなたの体験を知りたいです。
忘れていましたが、各段階で自動キャプション付けを行いました。自動キャプションが好きなのですが、これは後で異なる学習要素を組み合わせる際に役立つと信じる、多くの重み付けされたコンセプトを提供してくれるからです。もちろん、この方法の方が簡単で速く、生成されたキャプションにしばしば含まれる誤りは、私にとって識別可能な形で現れません。




















