Shirtlift: a LORA for flashing tits

続編リリース：Skirtlift

女性が上着を引っ張り上げるような画像を生成するプロンプトを作成するのが難しかったため、このLORAを作成しました。男性にも対応しています。

モデル Liberty を使用して生成されたサンプル画像。

EDIT：一部の方から、どのように作成したのかを尋ねられたので、ざっくりとした手順を紹介します。

ワークフロー：

インターネットからテーマ（女性が上着をめくっている）に合った画像を探します。異なる体型・服・場所の画像をできるだけ集めましょう（ただし、AIが学習できるように、テーマの整合性は維持する必要があります）。
画像をクロップし、タグ付けします。データセットが小さい場合は手動でクロップした方が良いですが、こちらは100枚以上あったため自動化し、不適切なクロップを削除しました。（これに使えるツールは多数あります。私は Automatic1111 用の Smart Process エクステンションを使用しました）。

2a. テーマを表すタグ（例：flashing、pulling back shirt など）を削除し、汎用タグ「shirtlift」に置き換えます。

2b. 間違ったタグを修正します。

4a. テーマが正しく捉えられていない？　テーマの変化が大きすぎる画像（たとえば、上着がしわしわになってAIが「Tシャツ」と認識できない、または手の動きが複雑な画像）を削除します。

4b. テーマに含まれない要素が再生されてしまう？　その要素をデータセットに過剰に含んでいる画像を削除するか、またはプロンプトでその特徴を指定して、AIがそれらを汎用タグの一部だと誤認しないようにします（例：今回は固定的な顔の特徴や体形が強調されてしまっていた）。

4c. どうも不具合が起きているが、具体的に説明できない？　訓練設定を変更します。（まだ試行錯誤ですが、ガイドもいくつかあります）。

4d. 上記の変更をもとに、ステップ3を繰り返します。

5a. もし本当に生成したい要素がうまくいかない場合、その要素を含む例をデータセットに追加してみてください。

設定

数回のフィルタリングを経て、最終的に104枚の画像を使用しました。

主に Linaqruf 氏の Kohya Lora Fine-tuner ノートブックのデフォルト設定を利用しましたが、以下の変更を行いました：

モデル：SD1.5
mixed_precision：FP16
Network Dim + Network_Alpha：64
LR_Scheduler：cosine_with_restarts
Dataset_Repeats：2
Clip_Skip：1

どれが重要なのかはまだよくわかっていません。自分の試行錯誤のままです。

詳細情報については、こちらの参考になるガイドをご覧ください。