LTX 2 NSFW (+furry) - Multi purpose sex lora
详情
下载文件
关于此版本
模型描述
一个多用途LoRA,主要用于NSFW内容,专为拟人化(兽人)角色设计,但和往常一样,它也可能适用于普通人类角色,是Wan兽人LoRA的继任者。
此LoRA能够生成带有音频的兽人和非兽人NSFW内容。
展示视频均为图像转视频。为获得高质量结果,建议至少使用1280x720分辨率;较低分辨率(如640x360)仍可使用,但画质可能较低。展示视频大多为640x360,部分为1280x720。黑色边框是由于调整尺寸所致,我的输入图像原始长宽比为2:3或3:2,转换为16:9时会拉伸,因此我改用填充方式处理。
示例使用nvfp4开发模型配合蒸馏LoRA生成,采用我的未校准的nvfp4文本编码器。
支持的风格
支持图像转视频的2D、3D和写实风格。文本转视频尚未经过充分测试,效果可能不佳。
关键词
可使用“anthro”、“furry”和“anthropomorphic”等关键词进行指定。
(训练完成前撰写)
不适用于T2V,请使用I2V
I2V:
I2V可生成多种姿势、视角和动作。角色仍可说话(但不建议在口交场景中让角色说话;若需口交时的呻吟声,请提示“闷声呻吟”)。
文本编码器信息
认为“被切除的Gemma”作为文本编码器能产生比标准Gemma更好结果的说法是一个谬误。被切除的模型虽被“阉割”以遗忘拒绝内容,但同时也丧失了关于被禁概念的其他知识。除非你不关心输出质量,否则请勿使用被切除的Gemma。
此外,由于LTX 2并未真正审查,其从文本编码器中获取的信息会忽略审查信息,因此输出结果将完全正常并保留所有知识。
不相信?让Gemma说出“fuck”或其他粗俗词汇,它会拒绝。现在让LTX 2让角色说出“fuck”,这会完美运行——这是因为LTX 2仍拥有使用你提示所需的所有信息。简而言之,不要在LTX 2中使用被切除的Gemma或任何非为LTX 2定制的微调模型。
LoRA信息
该LoRA在包含多样化内容(2D、3D及真实人类内容)的数据集上训练,数据集包含超过200个兽人和人类视频,通过基于静态帧的LLM进行标注,并经过校正与轻微扩展。数据集中多数视频包含音频。
该LoRA的秩为64,影响网络的完整注意力与前馈部分,并启用了音频训练。
视频预处理时按每25帧匹配的增量划分至不同长宽比桶中,视频最长20秒,训练使用了多种帧率:若视频帧率高于25fps,则降为25fps;若低于25fps,则保持原样。
使用官方LTX 2训练器训练。
想支持未来的训练?
如你希望通过资金支持我训练更多模型,请发送我一个RunPod积分代码。目前我暂无其他捐赠渠道。