Wilykit v3 - (Thundercats 2011)

详情

下载文件

模型描述

Wilykit v3 - 2011版猫族英雄

v3 的预览图利用了 adetailer 扩展 在更高分辨率下生成并修补面部。

这是基于 (你猜对了) 2011年重启版《猫族英雄》中的 Wilykit 所制作的 LoRA。v3 是对训练过程的全面重构,应能 更灵活、更稳定、更准确地还原角色形象。

简而言之

使用

Wilykit, 尾巴

作为触发词

对于她默认的服装(根据构图需要可酌情删减)

wkoutift, 短上衣, 单肩带, 护臂, 腹部裸露, 单侧护腕, 工具腰带, 腰包, 短裙, 赤足, 分离式长裤

我建议初始权重设为 1.5(由于使用的训练方法,需要比通常更高的权重)。若追求更人类化的效果,0.8 的权重即可,但会丢失面部纹路和身体阴影,不过会提升灵活性。你可以将权重提高至 2.5-2.8 而不会出现伪影
权重越高 → 身体纹路越清晰

该 LoRA 应能适配大多数模型和风格 LoRA
甚至在写实类模型上似乎也能正常工作!

简而言之完毕,以下是更详细的内容!

从 v2 到 v3,训练过程的主要改进包括:

  • 从零开始重新训练,使用了大幅扩充的数据集。v2 仅约 40 张图,全部为粉丝艺术;v3 则超过 170 张,包含粉丝艺术与官方艺术的平衡分布。若计算头部裁剪图,总数将超过 250 张。训练方法与我此前制作 Mereoleona LoRA 的方式一致(详见其描述或下方说明)。

  • 所有图像的标签均手动标注,而非依赖上一版本的自动标签生成。

  • 专门针对 Wilykit 的标志性服装进行训练并打上标签。同时确保模型在更换不同服装时仍能保持灵活性,并防止默认服装的颜色“渗入”到用户提示的新服装中。

相比 v2,本版本基本消除了明显的缺陷:无法提示时默认服装颜色泄露、训练图风格干扰、尾巴缺失、面部/身体纹路未显现等问题。

目前唯一发现的问题是:偶尔会出现尾巴脱离身体的情况,有时尾巴形状不够准确,或者出现多个尾巴。但根据我对图像生成的经验,这类问题在生成角色时本就很常见,即使不使用 LoRA,尾巴也往往难以准确生成。

默认服装颜色渗入到其他服装中的问题,在绝大多数情况下应已显著改善。虽然在未明确提示颜色变化时仍可能出现少量颜色残留,但本次版本中更换颜色已变得更容易,不会再像以前那样必须频繁对抗颜色冲突,才能让角色换成非深蓝/紫的服装。

风格漂移问题已不再存在,经观察,整体风格趋向中性。某些标签可能轻微影响风格,但整体风格远比上一版更中性和稳定。

正如上文所述,由于训练方式的特殊性,需要比常规更高的权重才能充分展现角色的细节。如果面部纹路和身体阴影(如白色腹部、浅棕色身体、前臂与腿部下端为白色)对您不重要,使用标准权重亦无妨。该模型的训练方式确保了高权重不会影响整体风格,因为训练方法的核心目标之一就是最大限度减少风格漂移(这正是前版 LoRA 的主要问题)。

因此,高权重在实际应用中反而可能带来正面影响:更高的权重会使身体纹路更鲜明、对比度更强。虽然运行该 LoRA 通常需要更高的权重,但我认为这是值得的,因为这样可以让身体纹路变成一个“开关”,随时开启或关闭,而不会从根本上改变角色形象。

如果你对训练方法感兴趣(因为我一直在反复强调),其方法与我制作 Mereoleona LoRA 的方法完全相同。我将在近期发布更详细的教程,以下是快速说明:

  • 仅使用官方艺术制作一个 LoRA(fancaps.net 是你的最佳伙伴)。

  • 仅使用官方艺术,但仅使用你裁剪出的人脸图像训练另一个 LoRA。

  • 将这两个 LoRA 以 0.7:0.3 的比例合并(身体部分占 0.7,脸部部分占 0.3)。

  • 同样方法,但这一次仅使用粉丝艺术。

  • 将最终的粉丝艺术 LoRA 与最终的官方艺术 LoRA 再次以 0.7:0.3 的比例合并(粉丝艺术占 0.7,官方艺术占 0.3)。

最终合并出的 LoRA 应优于各组成部分的总和,不仅具备高度灵活性,还能保留角色固有的细节特征(得益于始终包含官方艺术的“常驻”训练数据)。

唯一权衡是,由于这是四个 LoRA 的合并,整体强度有所稀释,因此必须提高提示权重来补偿(这就是为何这里使用 2.0 的原因)。

我曾尝试用更高、略为过拟合的训练轮次(如直接使用会有过拟合现象)进行合并实验,希望多组结果在合并后能相互平均,但目前来看效果几乎可忽略不计。

此模型生成的图像

未找到图像。