XL realistic fursuit
详情
下载文件
关于此版本
模型描述
这是一个泛化能力很强的兽装LoRA,训练了三种常见的兽装风格(kemono fursuit、realistic fursuit、toony fursuit),可绘制后视图或仅头部。为提升泛化性并改善原始模型效果,还进行了许多其他方面的训练。下载时较小的文件是提示词示例。
该LoRA基于Ratatoskr训练,因为此模型支持多种风格,但自V8THL之后,该模型明显过训练,色彩异常,难以接受。因此,若需要更好的色彩与背景结构表现,建议使用此版本。
为改善原始模型效果,模型还训练了动漫风格、厚涂风格、128px像素风格、简约绘画风格、虚拟与现实结合等风格,并尝试优化柴犬的显示效果。
但由于具体概念可分配的图像数量有限,部分概念仅用几张图训练,可能需要多次尝试。多样性训练有助于缓解过训练现象,也可能提升在非训练目标上的泛化表现。
顺带训练了一些角色“猫十三”(cat13)、ori、三宝(sanbao)、净饭(jingfan),但使用的图像极少,这是为了避免概念干扰意外影响模型的泛化能力,因此未采用角色专属的训练方法。因此,这不是一个专门用于角色训练的模型,特征学习不足,效果不佳。
建议LoRA强度从0.6开始尝试,即使设置较低也能生效。部分概念可能需要更高强度,如0.85;设为1时图像质量会明显下降;某些特征明显的概念可能需要更低强度。
展开查看更多说明(机器翻译,点击“Show More”查看更多信息)
这是经过多视图训练的LoRA:

后视图训练图像较少,受基础模型影响较大。
(但若未训练后视图,则不会生成。)

进行了仅头部训练(fursuit head):

其他概念训练 Other concept training



角色“猫13”以及泛化能力测试
基础提示(注意是yuguo):
yuguo,digital drawing,anthro cat,red and gold hat,blue eyes,brown fur,
wearing red and blue outfit,kemono furry,


泛化能力测试(LoRA可能干扰原始模型的泛化能力,因此进行此实验):

已知问题:
基础模型Ratatoskr训练存在问题,显示效果不够自然真实。LoRA虽能缓解部分过度平滑与过度曝光问题,但整体效果仍不理想。
会出现不希望的光照,难以绘制深暗场景。高CFG可使画面更黑,但显得不自然;低CFG或降低CFG缩放可使画面更自然,但会降低质量。
可通过重绘纯黑图像来改善。
手部绘制效果不佳,LoRA可能降低手部质量,这可能是因为兽装的手与爪结构更抽象且相互遮挡。
数据集不够平衡,部分概念过训练导致过亮,这是LoRA造成的;某些结构质量下降,例如绘制刀具较困难。
- 有时可通过降低CLIP强度改善,但新概念依赖CLIP强度,降低后会失效;强度过低也可能导致部分图像崩溃。
兽装概念中蓝色偏多,有时会不可控地出现蓝色。
由于花纹复杂,有时存在颜色污染,条纹难以控制;我难以准确描述那些奇怪的毛色与纹理分布。
kemono风格常对物种不敏感,因为我标注时都难以区分物种,导致龙有时需手动添加“horns”。
全身照可能有些模糊,需较大尺寸才能呈现足够毛发细节。
可能难以指定内侧毛色(如难以绘制除白色以外的肚皮颜色),因数据太少且基础模型本身也难以实现,此问题在0610版本后有所改善。
- 我曾尝试专门标注以改善,但建议手动涂色,使用图生图功能解决。
模型区别:
1006
尝试改善光照,强制降低部分训练数据的饱和度与亮度,并添加一批黑暗环境图像进行训练。
增加更多与水互动的图像;添加更多改善美学的图像;增加更多半兽装图像。在部分测试中,细节表现不如上一版。
082x
V8THL 基于V8THL的色彩表现优于14.1,但可能不如Pony。可获得更深的背景,但前景仍偏亮。
Pony 基于Pony realism尝试,多风格表现不佳,但夜景与色彩表现优于14.1,可能更自然。通过负面提示引入写实风格,可加入一些非写实风格如动漫。
14.1 基于最新Ratatoskr14.1,但请注意,基础模型存在色彩与夜景表现不佳的问题,LoRA似乎加剧了此现象。但你也可以将LoRA用于V8THL,观感比14.1更好。
增加更多图像训练,尝试更精确细致的描述。
尝试改善肚皮颜色与水中效果。
添加了一些doge图片。
改善钥匙链、厚涂、简约绘画等风格的效果。
引入更多分辨率与更高美学质量的图像。
添加ori与三相奇谭角色,仅少量训练。
但相比之前,训练轮次从14轮降低至10轮,可能训练不足。
0419
更换了一批高质量像素图,但训练略显不足;使用标准LoRA;色彩表现仍不如0312,问题可能在于基础模型。
0412x
厚涂等色彩表现不佳;使用Lycoris的LoCon;使用的像素图质量不高,画面凌乱;部分概念过拟合,部分欠拟合。
0312
训练内容相对较少,但曾训练“三头六臂”概念,效果不佳后放弃;在厚涂等非写实风格的色彩表现上较好;基于V8THLRatatoskr - V8 [THL]












