更新备注:
此次更新在 Runpod 的 H100S GPU 上训练了近 20 小时,花费约 50 美元,因此非常期待您的反馈和讨论 :) 我做这个纯粹出于学习和热情,我已决定,只要训练不出现倒退,我就努力将此模型打造成 Wan t2v 14b 中专用于展示勃起阴茎的“一站式”解决方案。(如果我有足够的资金继续使用 Runpod,或决定在我自己的 3090 上本地训练……)这次的改进幅度似乎明显更大,不妨试一试,相比 v.05 版本,即使仅添加了少量数据,您也会感到惊喜。不过请注意,这仍是测试版,尚未完美……
请查看下方更新说明以了解新增内容详情。
此 LoRA 基于 Wan 2.1 14B t2v 模型训练,专为女性用户提供中等至较大尺寸阴茎的正面视角图像。(我尚未用此模型生成过男性相关画面。)
重要信息:
触发词:PENISLORA(可直接置于提示词开头)
最佳强度:0.7-0.85(强度过高则多样性降低,过低则阴茎不明显)。我偏好 0.85。
版本更新 v0.6 说明:
我新增的数据包含口交、阴茎抚摸及更多角度的视频/照片。
此次在 v0.5 的 3.3k 步 / 42 轮基础上,额外训练了 6K 步 / 60 轮。
现在能从多数角度清晰呈现阴茎正面视图(尖端异常现象减少,但仍不完美)。
包含 1 个第一人称视角口交内容,但数据仍不足,尚无法真正实现 POV 视角,但可从侧面或正面拍摄。
我认为当前模型在表现手握阴茎或将阴茎纳入口中的场景上表现尤为出色。
可实现深喉,建议使用 “tip of penis” 指代阴茎头,用 “base of penis” 指代阴茎根部。
仍存在一些问题,如阴茎可能弯曲或拉伸,因模型强烈希望在手部顶端与阴茎尖端之间留出空隙。
v0.6 训练技术说明:
通过 init_from_existing 加载了第 42 轮的 LoRA 权重(下次将尝试从检查点恢复,但当前数据表现良好)。
重置全局步数为 0,基于继承知识启动全新训练。
向数据集中新增了 8 个带字幕的视频 + 8 张图片(分辨率相同)。
保留原有数据条目以确保连续性与强化效果。
未从完整的 DeepSpeed 检查点(global_step)恢复,仅使用 LoRA 状态。
基于加载的 LoRA 继续训练不会污染数据,安全用于行为扩展,损失仍在合理范围内。
工作流程:
我还附带了一个 .json 工作流文件,供您查看我使用的节点和设置。大部分设置基于 Kijai 的标准 Wan 14B t2v fp8 模型,优化用于 3090(如 tea-cache、slg、torch、sageattn、CFG star zero 等)。为最大化生成效率,我将帧数设为 65,使用 Wan 默认分辨率 832x480,配合插帧/超分,每 4 秒视频约需 10 分钟生成。
示例提示词:
一段高质量视频:一位裸体女性舒适地坐在一间柔和灯光的卧室木椅上,PENISLORA 完全勃起,轻轻贴靠在她的小腹上,她用一只手温柔抚摸,摄像机正对她的胸部高度固定,随着她轻微调整坐姿,身体产生细微动态,氛围温暖而亲密,写实风格。
一段高质量视频:一位拥有丰满自然乳房的美丽日本女性仰卧在铺着白色柔软床单的床上。她肤色白皙,短发为深蓝色耳际波波头,带有齐眉刘海和及颊侧发。身着黑白女仆装,上衣敞开,露出裸露胸部。她的 PENISLORA 勃起阴茎自然连接于骨盆底部、双腿之间,清晰可见。她面带温暖微笑,直视镜头,神情放松自信。一手紧握阴茎茎干,缓慢上下抚动。睾丸轻柔贴在床单上。摄像机位于她正上方,从头到骨盆完整捕捉其全身,面部清晰呈现。
一段高质量视频:从城市公交车内一名乘客的视角拍摄,正对坐在对面的美丽新加坡女性。她身穿紧身白色针织高领毛衣,乳头轮廓清晰可见。下身着短百褶裙,裙摆覆盖大腿,双腿微张。当公交车轻微颠簸时,她进一步张开双腿,露出完全勃起的 PENISLORA 阴茎——自然连接于双腿之间,随车身晃动而轻微摆动。阴茎茎干充血坚实,尖端在裙摆掀起处完全显露。她凝视镜头,露出顽皮而专注的微笑。周围乘客均面向前方或望向窗外,明显无视这一场景。车内被午后夕阳温暖照亮,摄像机保持正面坐姿固定视角。
一段高质量视频:一位拥有丰满自然乳房的美丽日本女性站在一家温馨现代咖啡馆的吧台后。她肤色白皙,短发为深蓝色耳际波波头,带有齐眉刘海和及颊侧发。仅着深绿色女仆围裙,系于颈腰间,胸部完全裸露。丰满的自然乳房在围裙低领下清晰可见。她的 PENISLORA 勃起阴茎自然连接于双腿之间,阴茎尖端从围裙下摆微微露出。她双腿微开,面带温暖微笑直视镜头,双手高举两杯外带咖啡,自豪展示。睾丸轻柔贴在围裙布料后方,从某些角度可见。摄像机位于上方并略微前倾,以明亮温暖的星巴克风格场景,完整捕捉她从头到膝盖的全身。
负面提示词:
色彩艳丽,过曝,静态,细节模糊,文字,风格,作品,画作,画面,静止,整体灰暗,最差质量,低质量,JPEG压缩残留,丑陋,残缺,多余手指,手部绘制不佳,面部绘制不佳,畸形,毁容,肢体形态扭曲,手指融合,静止画面,杂乱背景,三条腿,倒走,模糊眼睛,低细节面部,水印,图层,故障,面,屏幕残影,图像干扰,
背景信息:
使用 28 张 512x512 图像和 3 段 640x480 视频(16fps,约 65 帧)进行训练。
训练基于 Hearmeman 的优秀教程与 Runpod 环境,设置沿用其默认值,仅对图像重复次数设为 5。特别感谢 Seruva19 的吉卜力 LoRA 及其详尽的训练数据分享,没有这些参考,我无法完成此项目。
我在原有 65 帧基础上添加了一个自定义的 61 帧视频分桶。
大部分图像与视频中我都裁掉了脸部,仅 1-2 张保留了面部。
最终在约 3.5k 步、第 46 轮时停止,损失无异常,我认为可再训练数小时而无问题。
此次训练在 Runpod 的 H100S 上耗时约 10 小时,花费约 33 美元,非常感谢您的关注与反馈 :)
所有视频均裁剪并转为 16fps,每段约 3-4 秒。这对作为 Wan 训练新手的我是一次极佳的学习体验。
图像字幕通过 Joy Caption 自动生成,再手动润色以确保用词一致(统一使用女性代词,将“精液”改为“cum”等)。视频字幕为人工标注。
我制作此模型,是因为现有 Wan 的勃起阴茎 LoRA 虽不错,但我反感其中一些问题,如只训练巨型阴茎、手术疤痕、基于男性数据或强烈的晒痕。本数据集仅包含跨性别女性,我力求采集更多自然、女性化身体与乳房的图像,避免过于巨大的阴茎(尽管仍存在部分)。视频中包含射精和自慰场景,但当前 LoRA 对这两者表现仍不理想。我建议用于非硬核或无手部动作的视频。尽管我已在部分视频中成功生成自慰与射精画面。此模型在近距离与低角度仰拍时表现尤为出色。不过,请放心,此 LoRA 完全适用于男性生成。
一些技巧(v0.6 更新):
请将阴茎正确锚定于身体位置,例如加入描述:
“女性的勃起阴茎自然连接于双腿之间。”
射精效果略有提升,现在能从阴茎尖端喷出,比上一版更接近“cum”质感,但仍需更多训练。
“她们的嘴唇保持闭合干燥,唇边无液体。浓稠白色精液从她阴茎尖端喷射而出。”
当前 LoRA 已掌握侧面与上方视角,但仍无法实现 POV 视角,且阴茎头部倾向正面视角。未来版本我将尝试突破。若偏离正面角度过多,可能生成怪异阴茎。
我测试了与其他 LoRA 的组合,基本兼容良好,但混合使用时建议调整强度。
新版本易拉长阴茎,但也可能生成较短阴茎,有时需调整提示词或种子以避免阴茎过长。
嘴部现已能自然靠近并吮吸阴茎,模型也经“深喉”相关语料训练与标注。
警告:
我将此版本标记为“BETA”,因为我认为它尚未完善——您可生成极其逼真的阴茎,但也极易获得变形怪异的怪物阴茎……我会继续微调并恢复训练。我的下一个大项目是为另一部我喜欢的动画打造类似吉卜力风格的 LoRA。这个项目让我深刻学习了如何为 Wan 训练准备数据与标注视频。若您愿意提供建设性反馈,我将努力使其更稳定实用。尽管当前版本已能完成任务,仍强烈建议您试用。