Penis Lora (+Blowjob, +Cumshot) [Taz] - WAN 2.2 14b / 5B / 1.3b T2V & I2V (Wan 2.1 & 2.2) + Qwen
详情
下载文件
关于此版本
模型描述
关于此版本
我使用从5B模型重新标注的数据集进行训练,结果非常出色。这是我第一次对结果感到相当满意。请尝试一下。大多数示例均使用闪电速度LoRA和低分辨率(480x832)。我还发布了I2V版本。建议在I2V中使用t2v(0.5强度)搭配I2V LoRA(1强度)。
触发词: PENISLORA
这个LoRA能做什么?
此LoRA可在正面或侧面视角的男性或女性身上添加勃起的阴茎。其他角度(如第一人称视角)可能出现阴茎头朝后的现象。
它现在还能实现以下效果:
- 阴茎侧视图
- 射精 / 精液喷射
- 口交(数据集中标注了“blowjob”和“deepthroat”)
它不能做什么?
训练数据中没有包含插入行为。第一人称视角(POV)的图像也几乎没有,尽管训练数据中包含少量俯视图像和1个POV视频。
有时在口交并射精的场景中,阴茎会从紧闭的口中滑出。
推荐设置
该LoRA与新版闪电Dyno High模型配合效果很好。我将在示例工作流中提供链接。我倾向于使用Dyno High模型(不使用闪电LoRA),低分辨率时则在常规2.2 Low基础模型上使用闪电v2 LoRA。
数据集
- 84张512x分辨率的图像
- 43个256x分辨率的视频
(我让DP自动选择宽高比)
此数据集与2.2 5B模型完全相同,我未作任何修改。
训练
我使用了默认的扩散管道设置。
[优化器]
type = 'adamw_optimi'
lr = 2e-5
betas = [0.9, 0.99]
weight_decay = 0.01
eps = 1e-8
我曾困惑为何训练High模型耗时如此之久,直到训练超过60小时后才意识到:我把视频放进了图像目录,导致High模型仅在视频上训练,且被重复训练了两次(一次为极高分辨率)。修正这个问题后,我重新训练,从11K步开始,加入图像数据,训练至约13K步。实际上,即使没有图像数据,High模型效果也不错。
对于Low模型,我全程正确地混合使用了视频和图像数据。在训练约6K步时,我将图像分辨率从512提升至1024,未出现内存溢出(正好占用约24GB显存)。我最终训练至约10.5K步。此外,根据建议,我将Low模型的训练时间步范围设为完整范围(0到1,而非0到0.85),这或许能更顺畅地在高模型与低模型的加速LoRA之间切换。
我认为未来可制作一个新版本,增加更多视角(如POV和背面视角),使其适用于各种场景。那样的话,我认为每个训练阶段不需要10K步,约5K步的epoch看起来已经足够。
结果
我认为这得益于改进的标注和2.2基础模型本身质量的提升。这个LoRA的效果非常出色。
