XL realistic fursuit

详情

下载文件

模型描述

这是一个泛化能力很强的兽装LoRA,训练了三种常见的兽装风格(kemono fursuit、realistic fursuit、toony fursuit),可绘制后视图或仅头部。为提升泛化性并改善原始模型效果,还进行了许多其他方面的训练。下载时较小的文件是提示词示例。

该LoRA基于Ratatoskr训练,因为此模型支持多种风格,但自V8THL之后,该模型明显过训练,色彩异常,难以接受。因此,若需要更好的色彩与背景结构表现,建议使用此版本。

为改善原始模型效果,模型还训练了动漫风格、厚涂风格、128px像素风格、简约绘画风格、虚拟与现实结合等风格,并尝试优化柴犬的显示效果。

但由于具体概念可分配的图像数量有限,部分概念仅用几张图训练,可能需要多次尝试。多样性训练有助于缓解过训练现象,也可能提升在非训练目标上的泛化表现。

顺带训练了一些角色“猫十三”(cat13)、ori、三宝(sanbao)、净饭(jingfan),但使用的图像极少,这是为了避免概念干扰意外影响模型的泛化能力,因此未采用角色专属的训练方法。因此,这不是一个专门用于角色训练的模型,特征学习不足,效果不佳。

建议LoRA强度从0.6开始尝试,即使设置较低也能生效。部分概念可能需要更高强度,如0.85;设为1时图像质量会明显下降;某些特征明显的概念可能需要更低强度。

展开查看更多说明(机器翻译,点击“Show More”查看更多信息)

这是经过多视图训练的LoRA:

后视图训练图像较少,受基础模型影响较大。

(但若未训练后视图,则不会生成。)

进行了仅头部训练(fursuit head):

其他概念训练 Other concept training

角色“猫13”以及泛化能力测试

基础提示(注意是yuguo):

yuguo,digital drawing,anthro cat,red and gold hat,blue eyes,brown fur,

wearing red and blue outfit,kemono furry,

泛化能力测试(LoRA可能干扰原始模型的泛化能力,因此进行此实验):

已知问题:

  • 基础模型Ratatoskr训练存在问题,显示效果不够自然真实。LoRA虽能缓解部分过度平滑与过度曝光问题,但整体效果仍不理想。

    • 会出现不希望的光照,难以绘制深暗场景。高CFG可使画面更黑,但显得不自然;低CFG或降低CFG缩放可使画面更自然,但会降低质量。

    • 可通过重绘纯黑图像来改善。

  • 手部绘制效果不佳,LoRA可能降低手部质量,这可能是因为兽装的手与爪结构更抽象且相互遮挡。

  • 数据集不够平衡,部分概念过训练导致过亮,这是LoRA造成的;某些结构质量下降,例如绘制刀具较困难。

    • 有时可通过降低CLIP强度改善,但新概念依赖CLIP强度,降低后会失效;强度过低也可能导致部分图像崩溃。
  • 兽装概念中蓝色偏多,有时会不可控地出现蓝色。

  • 由于花纹复杂,有时存在颜色污染,条纹难以控制;我难以准确描述那些奇怪的毛色与纹理分布。

  • kemono风格常对物种不敏感,因为我标注时都难以区分物种,导致龙有时需手动添加“horns”。

  • 全身照可能有些模糊,需较大尺寸才能呈现足够毛发细节。

  • 可能难以指定内侧毛色(如难以绘制除白色以外的肚皮颜色),因数据太少且基础模型本身也难以实现,此问题在0610版本后有所改善。

    • 我曾尝试专门标注以改善,但建议手动涂色,使用图生图功能解决。

模型区别:

1006

尝试改善光照,强制降低部分训练数据的饱和度与亮度,并添加一批黑暗环境图像进行训练。

增加更多与水互动的图像;添加更多改善美学的图像;增加更多半兽装图像。在部分测试中,细节表现不如上一版。

082x

  • V8THL 基于V8THL的色彩表现优于14.1,但可能不如Pony。可获得更深的背景,但前景仍偏亮。

  • Pony 基于Pony realism尝试,多风格表现不佳,但夜景与色彩表现优于14.1,可能更自然。通过负面提示引入写实风格,可加入一些非写实风格如动漫。

  • 14.1 基于最新Ratatoskr14.1,但请注意,基础模型存在色彩与夜景表现不佳的问题,LoRA似乎加剧了此现象。但你也可以将LoRA用于V8THL,观感比14.1更好。

增加更多图像训练,尝试更精确细致的描述。

尝试改善肚皮颜色与水中效果。

添加了一些doge图片。

改善钥匙链、厚涂、简约绘画等风格的效果。

引入更多分辨率与更高美学质量的图像。

添加ori与三相奇谭角色,仅少量训练。

但相比之前,训练轮次从14轮降低至10轮,可能训练不足。

0419

更换了一批高质量像素图,但训练略显不足;使用标准LoRA;色彩表现仍不如0312,问题可能在于基础模型。

0412x

厚涂等色彩表现不佳;使用Lycoris的LoCon;使用的像素图质量不高,画面凌乱;部分概念过拟合,部分欠拟合。

0312

训练内容相对较少,但曾训练“三头六臂”概念,效果不佳后放弃;在厚涂等非写实风格的色彩表现上较好;基于V8THLRatatoskr - V8 [THL]

此模型生成的图像

未找到图像。