WAN 2.2 I2V - Edible Anuses
詳細
ファイルをダウンロード
モデル説明
これは比較的シンプルな低ノイズ専用肛門LoRAです。目的は、初期画像に肛門が見えない場合でも、適切な位置にリアルに見える肛門を生成し、大きく開いていたり酷使されていたりしないようにすることです。特に、私のPOV顔座りLoRAと組み合わせて使用することを意図しました。
このLoRAを有効にするには、プロンプトに「anus」という単語をどこかに含めるだけで十分です。ただし、WANはしばしば肛門の位置を正しく把握できないため、以下の文が非常に役立ちます:
A woman presents her anus. Her anus is directly above her vulva.
もちろん、被写体が仰向けの場合は、肛門を陰部の下に位置すると記述してください。このLoRAは、肛門の外観に関する詳細を追加できるように設計されています。たとえば:
a small round anus
The anus is pinkish in color
Her anus is centered, slightly puckered
このLoRAの学習データには、肛門と陰部が両方含まれていたため、陰部の形状や色を制御することも可能です。ただし、私はこれを十分にテストしていません。プロンプトにおいて重要なキーワードは「vulva」と「labia」です。
テスト
私はベースモデルとしてWAN 2.2 I2V Q8とライトニングLoRAのみを使用してテストしました。他の要素は一切含めず、WANの既知の能力とLoRAによって追加された要素を明確に区別できるようにしました。以下に最終フレームの対比を示します。左はLoRAなし、右はLoRAあり(重みは1から1.5の範囲)。
LoRAなし:

LoRA 重み1.0:

LoRA 重み1.5:

LoRA 重み2.0:

最終的には、実際に肛門の穴が現れていることが明らかです。この動画の初期フレームは以下の通りです:

とはいえ、私はさらに学習を重ねる余地があると考えていますが、初心者としてはまずまずのスタートだと感じます。
データセットと学習情報
入力データセットは、すべてRedditから直接収集した167本の動画です(サブレディットの名前は推測できるでしょう)。バッチは最初の3秒のみに切り詰め、フレームレートは16fpsに制限しました。
データセットはJoyCaption BetaとDarkAges 70bを用いて自動キャプション化されました。
学習は512ピクセル解像度で30エポック、1回の繰り返し、バッチサイズ2でDiffusion Pipeを使用して実施。学習率は2e-4です。
いつも通り、自分が何をしているのかまだ完全には理解できていないのですが、フィードバックを歓迎します!
