LTX2 i2v - Sexy Move
详情
下载文件
关于此版本
模型描述
这是用于 I2V 的。
仅用于生成的虚构成年角色。不包含脱衣数据。
我根本没试过 T2V,看起来效果不太好。这个数据集专为 I2V 设计。T2V 对我来说需要太多精力。但这个测试似乎还行。
有些人完全无法让 I2V 正常工作;这是我用于大多数预览的修改后的工作流。它使用了新的潜空间归一化——永远不会扭曲输出对比度,不会产生那种僵硬的运动缩放,除非有非常疯狂的提示,否则通常不会返回混乱的错误输出。该工作流包含大量自定义调整和推理,详情见该页面。
不要期待色情或裸露内容。裸露仍仅是从初始图像中“作弊”得来的。这个 LoRA 没有阴茎数据,只有部分假阴茎骑行动作辅助髋部运动和躯干摩擦。目前有一些 NSFW LoRA 似乎能与它配合得很好,但此版本的语音数据在 1.0 版本中仍需改进,本质上它还必须同时是一个“性感对话”LoRA。舞蹈和大多数身体动作仍显薄弱,需要更多数据。
强度:0.2-0.8
它可能严重干扰音乐和对话。1.0 版本下 0.8 的强度已足够用于所有动作。这实际上是过训练的,且有意为之,只为测试哪些数据权重最大。 结果是:语音和自体触碰效果较好,舞蹈和其他动作则不够理想。
提示词:
在提示词开头加上:
风格:写实 - 性感。
风格:写实 - 露骨。
性感:包含舞蹈与一般动作,如胸部摩擦。
露骨:聚焦于生殖器,低角度拍摄,生殖器触碰,大量呻吟。
之所以这样设置,是因为据我所知,这是真正的 LTX2 风格数据集标签,如 Style: style 或 video in the style of,即使不使用 LoRA 也有效。这旨在提供一个低层级的性感增强,以过滤垃圾输出,并与其他动作 LoRA 一起引导模型。
以下是一些针对此 LoRA 的其他有效概念。该 LoRA 足够强大,只要初始图像匹配良好,仅用风格提示就能获得输出,但尚未像 Wan 2.2 版本那样大幅简化流程——它仍会以慢动作呈现,仅有一些细微动作,因此仍需精心设计的提示和多次迭代。
训练建议:
尽可能多样化音频,而非仅视频——我仅训练了三位不同的女性配音,效果显而易见。除非切换到其他语言,否则大多数输出都会被相同的语音语调和音色主导。训练过程将它们混合成一个听起来像澳大利亚口音的女孩,我不清楚原因。我还仅训练了几段重复的背景音乐进行测试。除非音乐本身至关重要,否则不要用带人声的音乐训练。音乐数据会显现,但此 LoRA 下会随机忽略标签。我不确定它们是否与其他概念相关,还是标签标注不够好,或是字幕丢弃机制先剔除了它们。但你完全可以训练歌曲和音乐。
LTX2 在 512 尺寸、32 秩下对 I2V 流程学习良好——我认为我本可以再添加更多概念,以后会尝试。躯干和腹部舞蹈动作需要强化,但在实际的 v1.0 版本中,我计划加入女性自慰动作、更多后方动作,以及大量语音数据。此外,我还需要找到 LTX2 基础模型中准确描述下体动作(如磨蹭、扭臀、摇摆)的措辞,因为即使数据量充足,模型有时仍无法理解这些动作。
Abliterated 对此版本无关紧要——我没有用它训练。使用普通版与无审查版 Gemma 会产生完全不同的结果。Abliterated 版本会破坏对话,但若你想要那种效果,它似乎会让节奏更慢、更具情色感。硬核色情输出是用普通 Gemma 完成的,所以是的。它似乎仅在实际引入或建立裸露内容的 T2V 侧才具有显著影响,而即使使用此 LoRA 也无法实现。当然,这不是一个裸露或脱衣 LoRA。LTX2 并非真正被审查,只是对这些概念无知;而此 LoRA 建立了大量此类概念。
提示关键词:
视觉:
全身裸露。
她正在用身体做出性感动作
弹跳舞蹈
性感舞蹈
缓慢性感的髋部动作与扭动
左右摆动臀部
臀部扭动
用手抚摸身体。
触碰
跪姿时向后倾身,臀部朝向镜头。
转身背对镜头。
左右转身。
用手摩擦乳房。
抓住巨大的乳房并挤压在一起。
她正在弹跳并上下起伏。
正对镜头。
固定镜头。
从背后拍摄。
完美身材
曲线玲珑
瘦削
巨大自然乳房
巨大紧实圆润乳房
大乳房
大而圆润乳房
中等大小乳房
小乳房
大乳头
小乳头
下垂
紧实
阴道
内阴阴道
肛门
臀部
屁股
女性(年长)
白皙肤色女孩
黑人女孩
亚洲女孩
拉丁裔女孩
音频:
性感嗓音
说色情话
性爱呻吟与性感呼吸
性爱喘息
性感吸气
背景音乐:
欢快流行歌曲
嘻哈
硬核科技舞曲
轻科技舞曲
Dubstep 风格
说唱风格器乐
流行歌曲
背景音是空房间的环境音。
音乐从房间内的扬声器播放。
音乐通常忽略提示词。其出现频率可能会被降低。这纯粹是测试。如果你完全不需要音频,可将音频潜空间设为 1 帧。
我之所以标注这些视觉描述,是因为 I2V 的训练方式——除非对后续动作至关重要,否则你几乎无需描述主体。
尽管此数据集更大、训练时间更长,但 Wan2.2 版本仍能产生更一致的结果,这源于该模型中已有数据的大量演进——尤其是舞蹈动作,而本版本在躯干动作上仍显不足。LTX2 团队或许应训练一些垂直 TikTok 女孩,这可能比 Mr. Bean 动画片片尾字幕更有用。
