Penis Lora (+Blowjob, +Cumshot) [Taz] - WAN 2.2 14b / 5B / 1.3b T2V & I2V (Wan 2.1 & 2.2) + Qwen
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
このバージョンについて
私は、5Bモデルから新たに再キャプションされたデータセットを使用してトレーニングしました。その結果は非常に優れています。初めて、結果にとても満足しています。ぜひお試しください。ほとんどの例は、Lightning Speed LoRAと低解像度(480x832)で作成されています。また、I2Vバージョンもリリースしました。I2Vを使う場合は、t2vを0.5ストレングスで、I2V LoRAを1ストレングスでご使用ください。
トリガー単語: PENISLORA
このLoRAは何ができますか?
このLoRAは、正面または横から見た男性や女性に、勃起した陰茎を追加できます。その他の角度(例:POV)では、陰茎の先端が逆向きになる場合があります。
他に可能になったこと:
- 陰茎の横顔
- 射精/クマショット
- フェラチオ(「blowjob」と「deepthroat」という単語でキャプションされています)
できないことは?
トレーニングデータに挿入行為は含まれていません。POV角度からの描画もできませんが、上から見た画像数枚とPOV動画1本はトレーニングデータに含まれています。
ときどき、射精を伴うフェラチオでは、陰茎が閉じた口から抜けてしまうことがあります。
推奨設定
このLoRAは、新たなLightning Dyno Highモデルと非常に相性が良いです。例のワークフローでリンクを掲載します。私はDyno Highモデル(Lightning LoRAなし)を使用し、低解像度では通常の2.2 LowベースモデルにLightning v2 LoRAを適用するのが好みです。
データセット
- 解像度512xの画像84枚
- 解像度256xの動画43本
(DPにアスペクト比を自動選択させました)
これは2.2 5Bモデルとまったく同じデータセットです。一切変更していません。
トレーニング
デフォルトのDiffusion Pipe設定を使用しました。
[optimizer]
type = 'adamw_optimi'
lr = 2e-5
betas = [0.9, 0.99]
weight_decay = 0.01
eps = 1e-8
Highモデルのトレーニングに時間がかかりすぎている理由がわからず、60時間以上トレーニングした後、動画を画像ディレクトリに誤って配置していたことに気づきました。その結果、Highモデルは動画のみ(かつ、非常に高解像度の画像が2回含まれていた)でトレーニングされていました。これを修正後、画像をトレーニングデータに加え、11Kステップから約13Kステップまで再トレーニングしました。正直なところ、Highモデルはそのままで十分でした。
Lowモデルについては、最初から動画と画像を正しく使用し、約6Kステップで画像解像度を512から1024に上げました。OOM(メモリ不足)にはなりませんでした(ちょうど約24GBを使用)。約10.5Kステップまでトレーニングしました。また、一部のアドバイスに従い、Lowモデルは完全なタイムステップ範囲(0~0.85ではなく、0~1)でトレーニングしました。これにより、高速LoRAでHighからLowへのスムーズな切り替えが期待できます。
今後、POVや背面からの角度を追加したバージョンを作成しようと考えています。その場合は、1回のトレーニングに10Kステップ必要ないと思います。約5Kステップのエポックでも十分な結果が得られました。
結果
キャプションの改善と2.2ベースモデルの性能向上の両方が寄与したと思いますが、このLoRAは非常に良い成果を出しました。
