SakuraRain

详情

下载文件

模型描述

SakuraRain 是我最喜欢的两个检查点的50/50融合:RainPonyXLSakuraSushi XL。(去试试这两个模型吧,它们都非常棒)我希望得到一个兼具 RainPonyXL 的配色、良好的解剖结构(尤其是手指)和有趣的背景,以及 SakuraSushi XL 更大更可爱的动漫眼睛的模型。该检查点融合的目的是以动漫角色为中心,但同时也继承了 RainPonyXL 生成有趣风景的能力。在初步测试中,我得到了一些我喜欢的有前景的结果。我希望继续测试这个融合模型,并在这里分享我的创作。我也很高兴看到你们尝试生成的作品!

上方的示例图像未使用内补绘制(inpainting)、ADetailer,也未通过 img2img 进行任何编辑。不过,我确实对它们使用了 Hires. fix。(下方有处理过程的详细说明)

使用指南

此模型内置了 VAE。 你无需为其设置额外的 VAE。

关于使用建议,以下是我使用 Automatic1111/ForgeUI 时的个人偏好作为起始点。如果你已有使用 SDXL/PonyXL 检查点的经验,也可以自行调整参数进行实验。

生成设置

  • 尺寸分辨率:我倾向于肖像使用 832X1216,风景使用 1216X832。r_ain 使用 896X1152(肖像)和 1152X768(风景)。由于这是基于 SDXL 的检查点,1024X1024 适合 1:1 比例。

  • 采样方法:DPM++ 2M Karras、euler a 或 Restart,这完全取决于我的心情。

  • CFG:7,但 4-7 之间的值都可能有效。

  • 采样步数:25-35。通常 25、28 和 30 是我的幸运数字。如果你想看看哪个步数在特定种子下效果最好,可以尝试通过 X/Y/Z 图来观察哪种效果最佳。

正向提示词

由于这是基于 PonyXL 的模型,正向提示词应以如下开头:

score_9, score_8_up, score_7_up, score_6_up, score_5_up

不过,为避免浪费 token,我通常从以下开始:

score_9, score_8_up, score_7_up

此外,像“masterpiece”(杰作)和“high quality”(高质量)这类描述质量的词其实并不特别有用,因为 score 标签本身已经表达了质量要求。在描述你想要的内容时,PonyXL 是基于 booru 标签训练的,建议参考 booru 标签列表,或安装如 SD WebUI Tag Autocomplete 之类的工具辅助。不过,它仍然是基于 SDXL 的,例如我发现,说“chinese village”(中国村庄)比“east asian architecture”(东亚建筑)更能准确传达你的意图。你可以大胆创新,尝试不同的表达方式,但请记住,这个模型及其基础模型最擅长的是 booru 标签。

通常,我的正向提示词结构如下:

score_9, score_8_up, score_7_up, source_anime, {描述内容的提示标签}

负向提示词

关于是否应将低分标签(5 及以下)放入负向提示词,存在很多争议。我个人不包含它们,而且我尽量使负向提示词尽可能简短。这受到 @FallenIncursio 建议使用其检查点的启发,且在我的提示中效果很好。我的基础负向提示词从以下开始:

3d, monochrome, simple background

你可以省略 “simple background”,但我发现这个提示本身就能显著提升环境的趣味性,而 r_ain 也经常在他们的提示中使用它。

不过,负向提示确实有影响,但你不应一开始就列出所有你不想要的元素,如“bad hands”(手部差)、“extra fingers”(多余手指)、“extra toes”(多余脚趾)等。我的建议是:先用正向提示和一个种子生成图像,如果发现有问题,再逐步在负向提示中添加标签来消除这些缺陷。有时,即便不添加任何负向提示,仅通过调整正向提示中的关键词顺序、位置或权重,也能改变图像方向。因此,我的建议是:逐步迭代添加负向提示词

Hires. fix

这是一个有争议的观点,因为有些人认为应通过 img2img 在后期进行放大以获取细节,但我始终未能找到对我有效的方法。(如果你有更好的方法,请告诉我)我喜欢的做法是:先生成大量不使用 Hires. fix 的图像,然后回溯种子,筛选出有潜力的图像。如有需要,我会调整正向或负向提示词,增删关键词,直到获得满意的结果。然后我使用以下设置:

  • 放大倍数:1.5x。更高倍数容易导致意外结果,如多余手指、过长躯干等。

  • 放大器:对于动漫风格,我使用 4x_BooruGan_650k

  • 去噪强度:0.5–0.6。我从 0.6 开始,如果出现不喜欢的细节,就降到 0.5。有时我会尝试 0.7 并获得成功,但达到或超过此值时,容易出现多余手指、手、脚,以及肚脐位置偏移等问题。若低于 0.5,则细节改善不明显。

  • Hires 步数:0

ADetailer

我建议使用 ADetailer 修复图像中的细节,我的建议如下:

  • 对于面部,使用 face_yolove8n.pt,仅在 ADetailer 正向提示中加入描述面部特征的词,如眼睛颜色、眼部特征、脸红,或面部穿孔、体液等。我还发现,在 ADetailer 的正向提示中加入 LoRA 嵌入,有助于改善某些角色的眼睛着色。

  • 对于乳头,建议使用 ADetailer 乳头模型(动漫) 来检测乳头,并使用 ADetailer 乳头 LoRA 进行修复。请阅读如何使用该 LoRA,因为你需在 ADetailer 正向提示中同时包含 LoRA 嵌入和单词 “nipples”。同时,请确保将检测模型的置信度阈值设为 0.7,否则你可能会在肘部等奇怪位置检测到乳头。

  • 目前使用 ADetailer 修复手部效果甚微,建议忽略。

结论

希望你喜欢这个融合模型!我期待看到你们发布的作品。我也会尽量在此发布更多示例,以展示其可能性,请务必查看图片以获取提示词灵感。我要感谢 @r_ain 和 @Random992 允许我发布它们检查点的融合版本,并给予鼓励和建议。同时也要感谢所有参与此融合模型开发的其他人。

此模型生成的图像

未找到图像。