Sex Motion Helper (prototype)

详情

模型描述

此LoRA旨在为Hyvid的异性性爱场景增添更多动态与细节。应与其他运动LoRA配合使用,并使用直接的自然语言提示。请参考与本LoRA结合使用的其他LoRA的提示方法。

此LoRA从以下几个方面提升了其他性爱LoRA的效果:

  • 与角色LoRA结合时,运动更丰富。
  • 更广泛的运动和面部表情范围。
  • 更好的光影与环境表现。
  • 身体与解剖结构的更高细节。
  • 在高分辨率下输出更清晰——如出现模糊,请降低其他LoRA的强度。

使用技巧

  • 若出现抖动或突兀动作,尝试提高“flow shift”值。将默认值从9提升至17,可显著改善流畅度,尤其在结合角色LoRA时效果更佳。

  • 在0.2–0.3强度下添加Boreal LoRA,可改善手、脚及其他精细边缘的表现。

  • 最简单的使用方式:从你希望增加动态或细节的现有生成结果开始,使用相同种子,逐步添加此LoRA并尝试0.2、0.3等强度,直至找到最佳值。所需强度取决于其他LoRA,需进行一定实验。

  • 作为独立使用时,宽屏与竖屏比例会产生明显不同的效果。训练数据均为宽屏,包含摄像机平移、缩放及多样视角。宽屏效果更优,但需更精心设计提示词。

训练说明

v0.1与v0.2基于大量短篇PiV片段训练,但原始分辨率较低,导致较多伪影。

v0.3从零开始,使用5段4K、每段约30分钟的视频重新训练。我使用diffusion-pipe生成两组帧桶:121帧@244px与33帧@512px,采用overlapping_middle方法,使模型两次看到完整视频但采样不同。目的是让模型在高分辨率下学习短期运动,同时通过244px样本理解长期运动。我犯了一个错误:其中一段视频中女演员面部出现频率过高,导致模型对其面部过拟合。学习率为5e-5,训练约7千步。

v0.4在v0.3基础上,使用8段新视频(每段约1小时、4K源)进行训练,此次聚焦于第一人称视角(POV)。由于大多数其他性爱LoRA均为第一人称视角,我旨在提升其与这些LoRA的协同效果。所有源视频均为16:9宽屏比例,因此在宽屏下表现更佳。我将学习率降至1e-5以防止显著遗忘,总训练步数约1.2万步。截至目前,模型共见过约1.9万个独立样本,来自13段视频。

需注意的是,训练数据未包含任何文字标注,因此该模型不会引入新的文本偏见。其目标是弥补Hunyuan预训练中的空白——Hunyuan似乎未包含任何视频色情内容(因此能生成静态色情图,但无法表现运动)。

我曾在此基础上进行了一次微调(肛交版本),以测试模型是否能快速学习新概念。该微调同样无文字标注,仅使用一段视频,模型确实通过视频示例很好地掌握了该概念。我推测,若结合更多样化的源数据与文字标注,微调效果会更佳。

版本说明

v0.4

本版本基于第一人称视角性爱场景训练,旨在提升男性视角下的动作表现与理解。模型也具备一定第三人称视角理解能力,但目前仍较弱。本版本与第一人称视角LoRA(如传教士式、女上位、反女上位等)结合使用效果最佳。

宽屏比例能产生更流畅、更丰富的结果。训练数据均为16:9的4K视频,因此使用此比例可更贴近原始素材。竖屏比例会促使模型更偏向你所用堆栈中其他偏向竖屏比例的LoRA。

本版本仍存在“同脸”问题,源于前期一段过长视频在过高学习率下导致的过偏。本版本已减轻此问题,但需更多训练才能完全消除。下一版本将专注面部细节、表情与多样性。

多个画廊帖子中提供了示例工作流。主要策略是:以正常强度一半的现有性爱LoRA为基础,再叠加本LoRA,强度设为0.5至1.5。需进行一定实验,尤其在结合仅基于图像训练的角色LoRA时。

v0.3

本版本训练方式不同于前代,采用更高分辨率样本与更丰富的场景多样性。目前对瘦削金发女性存在轻微偏好,但可通过提示词加以引导。

单独使用时效果也很好:只需使用描述性提示词设定姿势,并调整LoRA强度与引导水平。我曾成功将仅基于图像训练的角色LoRA强度提升至1.3,几乎未损失动态表现。

与vid2vid配合效果极佳,如需更丰富的姿势,这是绝佳选择。

v0.3 - 肛交版

此为更实验性的版本,仅基于一段肛交视频训练,主要用于验证基础模型可通过特定训练引导学习新概念,从而为更多专项变体打开可能性。画廊视频中嵌入了在Comfy中复现的流程。抱歉未提供提示词指导——我在复用过往工作流时忘了开启“保存元数据”选项。

此模型生成的图像

未找到图像。