Asshole - Wan 2.2 T2V/I2V 14B
详情
下载文件
模型描述
在大量且多样化的数据集上训练而成,主要数据为女性仰卧并展示肛门。为防止偏差,还混合了正则化数据。
该模型在多种场景下表现优异,且有望在远超其原始设计任务的更多应用场景中表现出色。
支持文本到视频(T2V)和图像到视频(I2V)。
训练/数据集参数
- 259 个 3 秒长的 512x512 视频。
- 189 张 1024x1024 图像。
- 秩为 128。
- 高噪声阶段训练 18 个周期。
- 低噪声阶段训练 22 个周期。
- 数据较少的概念增加了重复训练次数。
- 学习率初始为 0.0001,训练最后约 20% 的阶段降至约 0.00002。
- 视频通过我自行编写的工具进行切片和裁剪。
- 标注:
- 初始标注使用 Qwen2.5-VL。
- 系统提示根据每个不同概念进行了定制,以提供上下文和指导模型关注的内容。
- 人工复核并进行轻微修正。
- 使用 diffusion-pipe 在单张 5090 显卡上训练。
训练内容包括:
- 女性处于“桩击”姿势
- 用手自行分开臀部
- 观众帮忙分开臀部
- 从下方拍摄的阴道特写
- 阴茎肛门插入
- 阴茎肛门抽出
- 阴茎肛门抽插
- 侧面视角
- 第一人称视角(POV)
- 多种阴毛密度,但我仍无法有效控制
- 射精,但难以控制
- 面部大多被裁剪出画面,以最小化角色溢出
无法实现的效果:
- 请勿期待站立姿势的良好效果——数据集中无此类样本。
请参阅与样本关联的提示词。