Nose Picking

详情

下载文件

模型描述

你好,这个模型旨在帮助生成“nose_picking”(抠鼻)标签未被IllustriousXL正确理解时的图像。

此前曾有一个LoRA尝试训练同一概念,但它是为SDXL设计的,在Illustrious版本上效果很差,因此我决定亲自训练一个(天哪,你根本不知道我多想放弃这个项目)。

在讨论版本之前,我想先简要总结一下这个LoRA:

  • 它有效吗?是的,它有效。
  • 它稳定吗?是的,只需极少量调整即可获得良好效果。
  • 为什么选择这个而不是其他?因为(在我写这段文字时)尚无其他替代方案。
  • 如何实现预览和版本部分所示的效果?我会尽量撰写详尽的“技巧”部分,总结我关于这个LoRA的所有经验;你也可以直接参考图库中的图片(我明天还会发布一些)。
  • 我喜欢这个模型,我该如何帮助?如果你喜欢我的作品——它所耗费的精力远超我愿意承认的——请留下评价,上传你的创作并分享给朋友。

大部分使用技巧已在版本部分列出,但如果你对更多技巧、提示和信息感兴趣,可以阅读下面的章节。

Nos3pick(v2)

此版本旨在协助生成包含“nose picking”(抠鼻)标签的图像。遗憾的是,IllustriousXL对该标签理解不佳,常生成其他手势(如“finger_in_mouth”很常见)。

v2(终于!)能够修复这一问题。尽管结果与我最初设想的略有不同,但效果相当不错。

最初计划是开发一个即插即用的LoRA,激活关键词为“nos3pick”……但第一次训练时,这个LoRA用起来相当笨拙(尽管仍比SDXL版本好)。于是我精选了测试中最优结果,构建了第二个数据集,重新训练,最终得到了这个版本。

这个LoRA基本实现了即插即用,你可以生成类似这样的图像:

当然,你可以自由调整表情,但为确保模型准确理解你的意图,可能需要额外添加关键词“nose pick”。

最后一次,我向你展示使用与不使用LoRA的差异:

不使用LoRA vs 使用LoRA

如你所见,LoRA确实有效(由于图像足够简单,我只需直接启用激活标签,无需任何额外调整)。

大部分测试均在Hassaku(Illustrious)WAI-NSFW-illustrious-SDXL上进行。

技术细节:

本版本训练所用数据集包含100张不同图像,训练了约13个epoch,每个epoch重复2次。(是的,步数很多,但相信我,它们都是必需的。)

我常用的设置如下:

采样器:Euler A
步数:~28 ~30
CFG:~6

图像经过放大并使用adetailer处理,以获得更佳的最终效果。

放大器:4x_NMKD-Siax_200k 
步数:15
降噪:0.3

Adetailer:
面部
全眼检测

注意:adetailer 用于任何手部优化 <- 因此手势效果100%来自LoRA。

(尽管我必须说明,在少数情况下,放大可修正手指未完全进入鼻孔或鼻子生成异常的图像。)

我遵循的提示结构为:

{你的提示}, <lora:Nos3pick:1> nos3pick, nose picking

有时你可能需要添加关键词“nose picking”以进一步稳定输出,或在图像过于复杂时使用(制作复杂表情时必须使用)。

那么如何使用它:

激活关键词:nos3pick,
[可选]:nose picking
LoRA权重:~1(1为最优值)

通常我会保持28步和CFG=6,然后尝试以下步骤:

仅使用激活关键词生成图像,判断是否需要第二个关键词。大多数情况下,不使用可选关键词图像已足够好;但如果效果不佳,我会添加第二个关键词(通常能解决问题);若种子特别差且此法仍无效,我会尝试开启额外关键词并稍作种子变化。

(注意:这种情况仅发生过一次,且我需要生成的图像提示本身极其混乱。)

我测试得足够充分了吗?好吧,我可以说我的GPU已经准备好晋升为烤面包机了。

第一次测试分辨率为832*1216:

(每种分辨率的测试包含两组前后对比图)

注意:两张图之间唯一的区别是LoRA和两个激活关键词的存在与否。

第二次测试(896*1152):

第三次测试(768*1344):

最后一次也是最重要的测试是针对已知角色的兼容性测试。我使用了我角色LoRA中的角色生成图像:

备注(技巧与窍门):

尽管并非必需(多数情况下),标签“nose_picking”对图像有极强的稳定作用,且在“nos3pick”之后使用该标签不会产生负面效果。因此,如果可能,请同时使用这两个标签。

标准表情较平淡,但当你同时使用两个标签时,可自由定制,无需担心。

此LoRA无需adetailer,但我强烈建议使用它以进一步提升图像质量。

以下标签均被完全支持:

张嘴,
微笑,
咬牙,
半闭眼,
格拉斯哥微笑,
冷笑,
;d,仅上牙
等等。

还有一些注意事项:

  • 如果你未明确说明室内/室外,也未描述背景,LoRA很可能生成室内图像。
  • 强烈建议不在正向提示中使用关键词“portrait”。
  • 建议在负向提示中使用关键词“close-up”。
  • 该LoRA基于“女性”图像数据集训练,因此若用于男性,需大幅降低LoRA权重(我在使用Brook时将其降至0.6)。

我希望这个LoRA能对你们中的一些人有所帮助。我怀疑自己再也不会碰这个手势了,因此我可以断言:这就是它的终极版本(至少在未来一段时间内如此)。

非常感谢你读完这一切(我知道我说得太多了);希望你喜欢这个LoRA,期待在下个模型中再见。

此模型生成的图像

未找到图像。