Asshole - Wan 2.2 T2V/I2V 14B
詳細
ファイルをダウンロード
モデル説明
相当な量のデータとさまざまなコンセプトで学習され、主なものは背中を向けて肛門を露出する女性である。バイアスを防ぐために正則化データも併用した。
このモデルは多様なシーンで良好なパフォーマンスを発揮し、意図されていたタスクよりもはるかに多くのタスクで優れた結果を出す可能性を秘めている。
T2VおよびI2Vで動作する。
学習/データセットパラメータ
- 3秒の259本 × 512x512 ビデオ
- 189枚 × 1024x1024 画像
- ランク 128
- 高ノイズ状態で18エポック
- 低ノイズ状態で22エポック
- データ量の少ないコンセプトでは繰り返し回数を増やした
- 学習率は両方とも0.0001から開始し、最後の約20%の学習では約0.00002に低下させた
- ビデオは私が作成したカスタムツールでスライス・トリミングした
- キャプション生成:
- 初期のキャプション生成にはQwen2.5-VLを使用
- 各コンセプトごとにシステムプロンプトを調整し、モデルに文脈と注目すべき要素を指示
- 手動でレビューし、小幅な修正を加えた
- 単一の5090 GPU上でdiffusion-pipeを用いて学習
学習対象内容:
- パイルドライバー体位の女性
- 自分の手で臀部を広げる
- 視聴者が臀部を広げる
- 陰部の下からのクローズアップ
- 陰茎の肛門挿入
- 陰茎の肛門抽出
- 陰茎の肛門突き刺し
- 横からの視点
- POV視点
- 陰毛の多様性(ただし、何らかの理由で制御できない)
- 射精(制御が困難)
- 文字の漏れを最小限にするため、顔はほとんどの場合フレーム外にカット
できないこと:
- 立ち姿勢での結果は期待しないでください。データセットには存在しません。
サンプルに関連するプロンプトをご覧ください。