Pony: People's Works v1-v6
详情
下载文件
模型描述
简介:
一个画风LoCon,使用从Civitai网站收集的、拥有“最多收藏”和“最多点赞”的pony系模型图像训练而成。
这个LoRA并不旨在模拟任何特定艺术家的风格或技法,但在一定程度上可能反映了社区的审美倾向与图像的视觉吸引力。不同提示词下,风格可能会有细微变化。
使用方法:
V2之前的版本没有特定触发词,请使用对应模型自带的质量标签。
对于V3及后续版本,训练了以下标签:
正面标签:
masterpiece, best quality, very aesthetic
负面标签:
worst quality, low quality, displeasing
你可以在这些基础上自行编辑提示词。
数据版本:
v6:
新增了500多张图像,部分选自Flux。删除了一些我认为质量较低的旧图像。
目前数据集总图像数已超过3000张,六个版本中累计手动增强/修改了20多个概念。
模型的rank也已提升。
v5.9:
模型表现未达预期,但我认为训练集中的图像本身质量尚可。计划手动调整标签,观察效果变化。
2025/1/3更新:
手动更新了部分标签,但它们似乎与亮度和色彩无关。暂且推测可能与noise offset有关。
v5:
数据集扩展至2,154张图像,其中约1,000张为Pony风格图像作为主要训练目标。
尽管V-pred模型可以使用基于Eps-pred训练的LoRA,但输出质量会显著下降。本版本将在两种不同类型的模型上分别训练。
NoobAI近期版本存在明显伪影,但Danbooru的“jpeg artifact”标签似乎效果不佳。为此,我们专门挑选了约30张具有典型且肉眼可见伪影的图像作为负样本。
观察到一种现象:Pony v6 和 NoobAI 在生成带侧发的发型时,倾向于在发根处生成一个三角形隆起。在Danbooru中,这种结构有时被标注为“hair intakes”或“curtained hair”,但Pony模型将其应用于所有角色。这是Pony训练角色时发型难以贴合预期的关键原因;NoobAI也出现了类似问题。我推测,这一特征在Danbooru之外的某个数据集中普遍存在,但未被正确标注。
数据集中的图像经过筛选,约三分之二已正确标注。目前,在提示词中加入“hair intakes”**可能在一定程度上**缓解该问题,但我尚未找到彻底解决方法。
v4:
部分优化了数据集标签,基于 NoobAI Epsilon-pred v1 进行训练。
Pony系模型极易生成耳环、耳钉等耳部配饰,有时会破坏角色耳部结构。我重新整理了相关标签,对数据集中部分结构轻微异常的图像进行了裁剪与手动修正,并移除了难以修复的图片。
v3:
数据集扩展至1,429张图像,包含正面与负面示例。
其中774张为最受欢迎的风格图像。
基于 Illustrious v0.1 训练。
v2:
数据集扩展至374张图像。使用模型自带的质量与美学标签控制生成效果。
v1:
从Civitai采集224张图像,393张用于正则化训练。
基于 Animagine v3.1 和 Pony v6 训练了两个版本。
test ver.4:
模型略欠拟合,但仍有效。我发现Animagine v3.1自带的质量标签与美学标签(如best quality, masterpiece, very aesthetic等)会影响此检查点生成的画风。因此,本测试版本建议不使用这些标签。下一版将修复此问题。




















