Pony: People's Works v1-v6

详情

模型描述

简介:

一个画风LoCon,使用从Civitai网站收集的、拥有“最多收藏”和“最多点赞”的pony系模型图像训练而成。

这个LoRA并不旨在模拟任何特定艺术家的风格或技法,但在一定程度上可能反映了社区的审美倾向与图像的视觉吸引力。不同提示词下,风格可能会有细微变化。

使用方法:

V2之前的版本没有特定触发词,请使用对应模型自带的质量标签。

对于V3及后续版本,训练了以下标签:

正面标签:

masterpiece, best quality, very aesthetic

负面标签:

worst quality, low quality, displeasing

你可以在这些基础上自行编辑提示词。

数据版本:

v6:

新增了500多张图像,部分选自Flux。删除了一些我认为质量较低的旧图像。

目前数据集总图像数已超过3000张,六个版本中累计手动增强/修改了20多个概念。

模型的rank也已提升。

v5.9:

模型表现未达预期,但我认为训练集中的图像本身质量尚可。计划手动调整标签,观察效果变化。

2025/1/3更新:

手动更新了部分标签,但它们似乎与亮度和色彩无关。暂且推测可能与noise offset有关。

v5:

数据集扩展至2,154张图像,其中约1,000张为Pony风格图像作为主要训练目标。

尽管V-pred模型可以使用基于Eps-pred训练的LoRA,但输出质量会显著下降。本版本将在两种不同类型的模型上分别训练。

NoobAI近期版本存在明显伪影,但Danbooru的“jpeg artifact”标签似乎效果不佳。为此,我们专门挑选了约30张具有典型且肉眼可见伪影的图像作为负样本。

观察到一种现象:Pony v6 和 NoobAI 在生成带侧发的发型时,倾向于在发根处生成一个三角形隆起。在Danbooru中,这种结构有时被标注为“hair intakes”或“curtained hair”,但Pony模型将其应用于所有角色。这是Pony训练角色时发型难以贴合预期的关键原因;NoobAI也出现了类似问题。我推测,这一特征在Danbooru之外的某个数据集中普遍存在,但未被正确标注。

数据集中的图像经过筛选,约三分之二已正确标注。目前,在提示词中加入“hair intakes”**可能在一定程度上**缓解该问题,但我尚未找到彻底解决方法。

v4:

部分优化了数据集标签,基于 NoobAI Epsilon-pred v1 进行训练。

Pony系模型极易生成耳环、耳钉等耳部配饰,有时会破坏角色耳部结构。我重新整理了相关标签,对数据集中部分结构轻微异常的图像进行了裁剪与手动修正,并移除了难以修复的图片。

v3:

数据集扩展至1,429张图像,包含正面与负面示例。

其中774张为最受欢迎的风格图像。

基于 Illustrious v0.1 训练。

v2:

数据集扩展至374张图像。使用模型自带的质量与美学标签控制生成效果。

v1:

从Civitai采集224张图像,393张用于正则化训练。

基于 Animagine v3.1Pony v6 训练了两个版本。

test ver.4:

模型略欠拟合,但仍有效。我发现Animagine v3.1自带的质量标签与美学标签(如best quality, masterpiece, very aesthetic等)会影响此检查点生成的画风。因此,本测试版本建议不使用这些标签。下一版将修复此问题。

此模型生成的图像

未找到图像。