Nana - Nana to Kaoru
详情
下载文件
模型描述
大家好,这是我的另一个小众LoRA,专为《娜娜与薰》系列中的娜娜角色生成而设计。
该LoRA旨在测试在CivitAI训练器上同时训练一个角色与多种风格的可行性,我必须说,实际效果远超预期。
免责声明:尽管此LoRA并非用于生成NSFW内容,但它仍可能被用于生成此类图像,请谨慎使用 :)
基础版本
此版本包含以下不同关键词:
n4n4 <-- 用于生成角色的关键字
bow <-- (可选)在使用低LoRA强度时非常有用
----------------------------------------------------------------------------
from_anime <-- 此标签训练成功,但用于训练的图像质量较低,因此现在它作为负面标签使用(详见“细节”部分以了解大致情况)
----------------------------------------------------------------------------
from_manga <-- 如果你想以漫画风格描绘娜娜,请使用此标签。它适用于黑白或彩色图像(如需生成黑白图像,应与“monochrome”和“greyscale”标签配合使用)
----------------------------------------------------------------------------
from_illustration <-- 使图像风格更贴近系列中的插画风格,它对背景有轻微偏向(尤其是渐变色背景)。如需特定背景,请在提示中明确描述,不要仅使用“简单背景”等泛化表达
LoRA强度建议设置在0.5至1之间,具体取决于所需效果(更多细节请参见“细节”部分),我建议使用0.7–0.8的强度。
我本人主要使用Euler采样器进行测试,但与其他采样器配合使用时也应无明显问题(前提是该采样器在你使用的模型上表现良好)。
关于模型兼容性,该LoRA在大多数模型上表现尚可,但不同模型可能需要调整LoRA强度(例如,使用Hassaku模型时,需降低LoRA强度,否则图像会过度饱和)。
细节:
此版本使用33张图像训练,每种来源(漫画、动画、插画)约10张,以便模型能牢固掌握角色特征并大致理解不同风格。
为检查是否存在任何偏差,模型已多次测试,结果如下:
(本节测试均使用Anylora ckpt剪枝版,分辨率512*768,采样步数40,未使用inpaint、highres.fix或adetailer)
测试1

首次测试旨在验证LoRA是否已掌握“n4n4”概念。如你所见,当LoRA强度达到0.5时,其对生成效果的影响已明显显现,符合预期。(备注:角色并无预设服装,你可能需要明确指定如“school_uniform”或“white_shirt”等细节)
测试3至5使用相同的LoRA强度,顺序相同(同时测试了正面提示(上方)和负面提示(下方)的效果)
测试2

第二次测试旨在检查LoRA是否存在镜头角度偏差。在LoRA强度为1的情况下,我们对多个角度进行了多次测试,结果显示当镜头角度被明确指定时,无任何问题;若未指定,模型倾向于生成“上半身”图像,类似“牛仔镜头”+“肖像”视角。
测试3

第三次测试旨在评估在正向提示(上方图像)和负向提示(下方图像)中使用“from_anime”标签的效果。
可见,当LoRA强度介于0.5至0.7时,该标签对风格影响显著。在正向提示中使用,会产生低质量图像;而在负向提示中使用,反而能使生成结果更稳定。
测试4

第四次测试旨在评估在正向提示(上方图像)和负向提示(下方图像)中使用“from_manga”、“greyscale”和“monochrome”标签的效果。
可见,当标签用于正向提示时,风格与漫画高度吻合;而用于负向提示时,模型会趋向生成更“插画”/“漫画封面”风格的图像——同时避免了娜娜脸部常出现的“厚嘴唇”问题。
测试5

第五次测试旨在评估在正向提示(上方图像)和负向提示(下方图像)中使用“from_illustration”标签的效果。
两种用法均令人满意,但需指出:在负向提示中使用该标签,可能生成偏向NSFW的图像。
备注:在大多数测试中,我持续使用了此标签(有时也与“from_manga”标签结合使用,效果极佳),但你可能需要微调该标签的强度以获得特定效果(例如,我曾生成一张很棒的图像,但娜娜的嘴巴形态异常,这是因为视角过窄,而“from_illustration”标签试图生成厚重嘴唇,模型无法处理;解决方案是将该标签强度降至约0.7–0.8)
测试6

本测试旨在探索将风格标签(正向提示中使用“from_manga”和“from_illustration”,负向提示中使用“from_anime”)混合使用的效果。
结果稳定,即使在LoRA强度为1时也是如此。但当使用此策略且LoRA强度为1时,建议微调风格标签的强度。一个实用的规则是:两个风格标签的强度总和不要超过1.5。
总结
这并非我最出色的LoRA,可能对大多数人帮助有限,但我仍愿分享,原因如下:
第一,其输出质量尚可,且我尚未在其他地方找到该角色的同类LoRA。
第二,它突显了高质量数据集的重要性——用于训练的动画图像质量太差,若剔除它们,LoRA效果可能更佳。
第三,我真心认为,对LoRA进行系统测试,并总结投入的思考与努力,能让你从中获得远超预期的学习收获。
一如既往,如果你喜欢这个模型,欢迎分享你的生成作品,并捐赠一些Buzz以支持我 :)




















