FootLickingV1
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
このLoRAは、男性が女性の足の裏を舐める(フットリック)という画像を生成する際の精度と品質を向上させるために作成されました。このようなコンテンツは、多くのモデルで誤解され、男性の顔が足の裏の近くにない、または単に女性が舌を出しているだけといった不正確な生成がよく起こります。私はこれを少なくとも部分的に修正することを目的としました。
V1:このLoRAはNoobAiXLV-Pred 1.0で学習されましたが、他のIllustriousベースのモデルでもよく機能します→V予測ベースでないモデルでも問題なく動作します。なぜこのようなことが起こるのかは不明ですが、そのためこのLoRAをV予測モデルとはラベル付けしませんでした。
学習について:
65枚の画像から構成されたデータセットを用いて学習しました。すべて手動で選別し、背景や画像内の各種テキスト要素をマスクして除去しました。学習は、以下のV予測ガイドに従ってOneTrainerを使用して行いました:https://civitai.com/articles/8723/vlora-or-how-to-train-a-lora-on-v-pred-sdxl-model
および、以下のガイドの設定を参照しました:https://civitai.com/articles/8723/vlora-or-how-to-train-a-lora-on-v-pred-sdxl-model
2番目のプログラムの設定の方が1番目のガイドの設定よりもはるかに優れていたものの、それらは主に外国語で書かれたトレーナーの使用を推奨していました。OneTrainerは英語で作成されており、マスク付き学習もサポートしているため、適用可能な設定を移行し、これを私の標準的な学習方法としました。設定の変更内容は以下の通りです:
すべてのデータタイプ = bFloat16
オプティマイザー = AdamW8-bit
一般およびUnetの学習率 = 0.0001
学習サイクル = 1.0
テキストエンコーダの学習率 = 0.00001
勾配蓄積ステップ = 4
LoRA alpha = LoRA rankと同値(32)



