Asshole - Wan 2.2 T2V/I2V 14B

详情

模型描述

在大量且多样化的数据集上训练而成,主要数据为女性仰卧并展示肛门。为防止偏差,还混合了正则化数据。

该模型在多种场景下表现优异,且有望在远超其原始设计任务的更多应用场景中表现出色。

支持文本到视频(T2V)和图像到视频(I2V)。

训练/数据集参数

  • 259 个 3 秒长的 512x512 视频。
  • 189 张 1024x1024 图像。
  • 秩为 128。
  • 高噪声阶段训练 18 个周期。
  • 低噪声阶段训练 22 个周期。
  • 数据较少的概念增加了重复训练次数。
  • 学习率初始为 0.0001,训练最后约 20% 的阶段降至约 0.00002。
  • 视频通过我自行编写的工具进行切片和裁剪。
  • 标注:
    • 初始标注使用 Qwen2.5-VL。
    • 系统提示根据每个不同概念进行了定制,以提供上下文和指导模型关注的内容。
    • 人工复核并进行轻微修正。
  • 使用 diffusion-pipe 在单张 5090 显卡上训练。

训练内容包括:

  • 女性处于“桩击”姿势
    • 用手自行分开臀部
    • 观众帮忙分开臀部
  • 从下方拍摄的阴道特写
  • 阴茎肛门插入
  • 阴茎肛门抽出
  • 阴茎肛门抽插
  • 侧面视角
  • 第一人称视角(POV)
  • 多种阴毛密度,但我仍无法有效控制
  • 射精,但难以控制
  • 面部大多被裁剪出画面,以最小化角色溢出

无法实现的效果:

  • 请勿期待站立姿势的良好效果——数据集中无此类样本。

请参阅与样本关联的提示词。

提示词大师们,请分享你们的作品。

此模型生成的图像

未找到图像。