【Clothes】珊瑚宫心海 | Kokomi Costume (Genshin Impact)

详情

模型描述

这是一个小实验,尝试了一种新的炼制特定服装概念的方法:手动正则+差异炼丹。其中,蒙版训练集图片106张,目标训练集图片77张。

该服装概念的主要训练难点在于去除画风和脸部影响,因此训练过程较为复杂。

当前版本已是目前炼制出的最佳版本,由于全部精力都集中在服装的固化上,我无法保证其具有良好的泛化性。当然,所有关于心海的人物特征均已整合进 sangonomiya kokomi 这个标签中,你也可以将其当作心海的角色 LoRA 使用,但效果应该不会优于站内其他的心海模型。

触发词:official costume, white short shorts, choker, wide sleeves, white thighhighs, vision \(genshin impact\)

示例:1girl, green hair, green eyes, solo, official costume, wide sleeves, white short shorts, white thighhighs, bare shoulder, choker, necklace, vision \(genshin impact\), outdoors, street, hair ornament, navel

目前该方法已基本成型,但仍存在一些尚未解决的小问题,主要包括:

  • 该方法要求目标角色具备一定的泛化能力,即需要拥有与目标训练集图片数量相当甚至更多的蒙版训练集。此处指的是穿着各种不同服装的心海同人图。因此,对于非常冷门、且没有替代服装的角色,该方法不适用。(或许存在一个最小训练集阈值?比如我最初训练 DreamBooth 时,正则化训练的默认参数为20张图片。我不清楚 LoRA 是否也仅需20张图片就能保证模型的泛化能力)

  • 某些服装细节的生成不够稳定,例如短裤上镶嵌宝石的位置,使用 Anything 模型时常无法正确生成(原本应为宝石的地方会变成一个洞)。我感觉可能是服装部分欠拟合,但若继续训练,画风又容易过拟合,未来或可进一步优化其稳定性。

  • 头饰无法还原。可能是在实验过程中,向蒙版训练集中加入了一些带有头饰的心海图片(数量不多,约20%)。因此我推测需要对两个 LoRA 训练集的概念进行严格分离,剔除其中所有含头饰的图片。

  • 目标概念训练集的标签合并问题——如何在保证概念易于调用的同时,实现高拟合度。

  • 蒙版 LoRA 的拟合程度——过拟合可能增加目标 LoRA 的训练难度,欠拟合则可能导致目标 LoRA 更易受画风污染。因此我认为蒙版 LoRA 的选择很大程度上依赖直觉,但仍可寻得规律。

通常应优先选择过拟合程度较重的蒙版 LoRA,并根据后续训练结果决定是否调整。若你的训练集足够大,我个人推测,在相同 epoch 数下,蒙版 LoRA 的训练图片数量越多,后续目标概念的训练难度越低。这也是我建议蒙版训练集图片数应大于目标训练集的原因:若图片数量过少,可能出现画风与目标概念无法分离的情况(目标 LoRA 尚未充分拟合,却已开始受画风污染)。

例如,在训练这套服装时,我选择了一个过拟合较严重的 LoRA 用于第二步的差异炼丹(batch size = 4,epoch = 12,average key norm > 0.96)。当 batch size = 4 且 epoch > 10 后,模型开始出现画风污染迹象,而 epoch < 10 时服装仍处于欠拟合状态。考虑到模型 dim 值较低,后续画风变化幅度有限,应优先降低目标概念训练难度,因此我选用 epoch = 10 或 11 的蒙版 LoRA 进行第二步训练。

该模型不会上传至国内任何 AI 平台,因为这些平台通常有极其严格的图片审核制度。我估计一旦上传,样图一张都传不上去,会非常烦人。

所有人物模型均为自训练模型。若使用站内其他人物模型生成效果不佳,请务必不要差评,因为这个模型真的极难训练。

欢迎在评论区交流炼丹经验。

此模型生成的图像

未找到图像。