WAN 2.2 I2V - Edible Anuses
详情
下载文件
模型描述
这是一个相当简单的低噪声仅肛门LoRA。目标是在起始图像中未显示肛门时,在正确位置生成看起来逼真的肛门,避免出现明显裂口或被过度处理的情况。特别是,此LoRA旨在与我的第一人称视角坐姿LoRA配合使用。
只需在提示词中包含“anus”一词,该LoRA就会生效。然而,WAN似乎常常不清楚该把肛门放在哪里,因此以下提示非常有帮助:
一位女性展示她的肛门。她的肛门直接位于阴道上方。
显然,如果人物是仰卧姿势,则应描述肛门位于阴道下方。该LoRA还能添加一些关于肛门外观的具体细节,例如:
一个圆形的小肛门
肛门呈粉红色
她的肛门居中,略微皱缩
由于训练数据中通常同时包含肛门和阴道,你也可以用它来控制阴道的形状和颜色,但我尚未对此进行广泛测试。在提示词中,关键关键词是“vulva”和“labia”。
测试
我使用基础模型WAN 2.2 I2V Q8和闪电LoRA进行了测试,未使用其他任何组件,以便尽可能清晰地区分WAN自身的能力与LoRA引入的效果。以下是最终帧的左右对比图:左侧为无LoRA,右侧为使用LoRA(权重范围1至1.5)。
无LoRA:

LoRA权重1.0:

LoRA权重1.5:

LoRA权重2.0:

显然,最终我们开始生成出真实的肛门。请注意,这段视频的起始帧是这样的:

尽管如此,我认为它仍需要更多训练,但在我看来,这已经是一个不错的开端了。
数据集与训练信息
输入数据集包含167个视频,全部直接从Reddit获取(你可以猜到子版块的名称)。视频被裁剪为仅前3秒,并限制为16帧每秒。
数据集使用JoyCaption Beta和DarkAges 70b进行自动字幕生成。
训练在512分辨率下进行,共30个周期,重复1次,批次大小为2,使用扩散管道。学习率为2e-4。
和往常一样,我仍不确定自己是否真正明白在做什么,欢迎任何反馈!
