Racing Women
详情
下载文件
模型描述
我制作这个LoRA时,希望它能帮助生成穿着迷人赛车服装的女性图像,并不特别针对任何真实风格,而是带有一些性感的暗示。
我的源图是通过XL、Z-Image,甚至Qwen Image Edit 2511生成的,但我本人并不特别喜欢这一类型,因此我不确定人脸与角色的匹配度如何——虽然我个人并不在意这一点,但我确实欣赏这些服装所具备的潜力。我的初衷当然是在创建这个LoRA时避免任何真实人物的相似性。
尽管没有使用真实图像,我还是将所有面部彻底抹去,用白色覆盖,并在没有系统指令的情况下从这些图像中创建了LoRA,结果推理时主要生成的是没有面部的女性图像。
我为服装的细节和颜色设置了多种提示,并尽可能想象了各种姿势,所有姿势均为直立状态:坐着、倚靠或站立。
从这些图像中,我移除了大部分背景,为每张图添加了不同尺寸的白色背景,并仔细审视了我希望调整的部分,以引导训练朝向特定的服装风格、姿势和环境方向。
随后,我使用qwen-image-edit-2511生成了新一批图像,作为最终数据集,确保修复了面部并添加了我想要的细节。
然而,在我数百张图像的制作过程中途,我们遭遇了Flux Klein。我彻底测试了其基础版和四步版,最终选择了非量化的四步版本,并将其推至六步。由于该模型能快速生成可接受的源素材,我便采用它完成了整个数据集的制作流程。
我快速浏览了一遍结果,检查是否存在瑕疵和不一致之处,并将部分图像重新输入以进行润色或补充我之前未曾想到的细节。最终,我从中挑选了50张符合我目标的图像。
这就是我用于训练的数据集。我没有调整太多超参数,只是增加了512和768的维度以提升灵活性,使横向图像能获得更好的质量;我将训练步数提升至20,000步,整个过程大约耗时3小时。
在整个数据集制作流程中,没有任何裸露或性暗示的内容。
我通常不会在大多数LoRA描述中写入如此详尽的细节,但我觉得,如果我能多做几个这样的案例,其他人或许可以尝试我的方法,看看是否对他们有效。我很想知道你们的体验如何——无论是否采用了上述任何步骤。
我忘了提一点:我在每个阶段都进行了自动标注。我喜欢自动标注,因为它能提供大量加权概念,我认为这在后期整合不同学习部分时很有帮助。当然,这种方式更简便快捷,而且生成的标注中常出现的错误,我通常无法识别出来。




















