Pen-Gesture

详情

下载文件

模型描述

你好,此模型旨在帮助生成带有“penetration_gesture”标签的图像,而illustriousXL对该标签理解不足。

此前有其他用户上传了一个同用途的LoRA,但 personally 我觉得它不太稳定,因此我自行训练了一个,现在就在这里分享。

在讨论各版本之前,我想先用几点总结这个LoRA:

  • 它有效吗?是的,它确实有效。

  • 它稳定吗?是的,只需微调即可获得良好效果。

  • 为什么选择这个而不是其他LoRA?目前(撰写时),仅有一个为illustriousXL设计的LoRA试图实现这一手势,但依我拙见,这个更稳定、更通用。

  • 如何获得预览和版本部分所示的效果?可使用与建议相似的提示词/设置。

  • 我喜欢这个模型,如何支持?如果你喜欢我的作品(这耗费了远超我愿意承认的时间与精力),请留下评价,上传你的作品,并与朋友分享。

大部分使用技巧已在版本部分提供,但如果你想了解更多技巧、提示和信息,可阅读下面的章节。

Pen-Gesture(v1)

此版本旨在帮助生成带有“penetration_gesture”标签的图像。遗憾的是,illustriousXL对该标签理解不佳,常生成其他手势(如“kitsune no mado”),甚至更糟——可能将两个词拆开,生成NSFW作品。

v1 能有效解决此问题。虽然它并未完全达到我最初设想的效果,但表现已相当不错。

最初计划是用两个新标签“lefthandp3n”和“righthandp3n”替换“penetration_gesture”,以实现更可控的输出。

但这个计划很快失败了,因为仅80张图片的数据集不足以训练两个如此相近概念的独立关键词。不过,我们达成了核心目标:该手势现在已被LoRA完全理解。

不使用LoRA vs 使用LoRA

如你所见,该LoRA有效(整体为即插即用),但可能仍需些许微调(所有与手相关的生成皆如此)。

大部分测试在Hassaku (Illustrious)上进行,部分在WAI-NSFW-illustrious-SDXL.上完成。

我常用的设置如下:

采样器:Euler A
步数:~28 ~32
CFG:~6 ~6.4

图像经过超分并使用Adetailer处理,以获得更佳最终效果。

超分器:YandereNeoXL_200k
步数:15
去噪强度:0.3

Adetailer:
face
fulleyesdetection

注意:Adetailer 并未用于辅助手部生成 <- 所以手势效果100%来自LoRA。

我遵循的提示结构如下:

{你的提示}, righthandp3n, lefthandp3n <lora:Handp3n:1>

是的,你需要同时使用这两个关键词。

那么该如何使用:

激活关键词:righthandp3n, lefthandp3n
LoRA权重:~1(1为最佳值)

我常在负面提示中添加:“(fewer digits, extra digits, 4 fingers, 6 fingers)”(说实话,这来自我尝试其他人的LoRA时残留的习惯,但因不确定是否必需,故仍提及)

注意:输出结果会因CFG和步数差异而显著变化。若你找到一张喜欢的图,但不幸生成了六指,可微调这些参数,一两次尝试后即可获得理想结果。

通常我保持28步和CFG 6,然后尝试以下操作:

首先,用相同种子、步数30测试。如果仍不满意,则将CFG提升至6.2或6.4 <- 多数情况下这已足够。

我测试得够充分吗?嗯,可以说我的GPU曾被当作煎锅用过 xd。

首次测试分辨率为832*1216,即你先前看到的图像。

注意:两张推荐图像之间唯一的区别是LoRA及两个激活关键词的存在。

第二次测试(896*1152):

第三次测试(768*1344):

第四次测试(1024*1024):

第五次测试(1216*832):

第六次测试(1152*896):

第七次测试(1344*768):

最重要的一次测试是针对知名角色。为测试这一功能,我使用《妖精的尾巴》角色生成了几组图像(为简便起见,仅更换角色,提示词保持一致):

额外说明:

  • 使用横版分辨率时请注意:模型未使用宽图训练,因此可能表现不佳。为帮助模型,建议在负面提示中加入“multiple_views”标签,以避免生成类似“before/after”的图像。

  • 在提示时请注意,尽管数据集相对均衡,但未包含“深蓝色头发”的图像。因此,有时(取决于种子和提示词)可能出现如1152*896测试中那样的“浅蓝色头发”情况。

非常感谢你阅读完这些内容(我知道我话太多,还经常提供过多不必要的细节);希望你喜欢这个LoRA,期待在下个模型中再见。

此模型生成的图像

未找到图像。