Taikaponi

详情

下载文件

模型描述

这是一个基于Pony的检查点合并模型,采用“训练差异”(Train Difference)方法针对不同的检查点和LoRA合并进行训练,而非常规的直接合并。

LoRA并未直接应用于检查点,而是将模型“训练”为趋向于其他检查点。

目标是提升“基础质量”并改变Pony的原始“本征”风格,使其在更少使用负面提示的情况下生成更优图像。

然而,我注意到一些使用“基础Pony”训练的LoRA也继承了其绘图风格,因此当应用于本模型时,会扭曲其绘图风格。

本模型基于Pony基础,因此所有相关标签和提示均可正常使用;但由于是合并模型,部分功能可能在过程中出现异常。

我用它创作得很开心,因此想分享出来,供他人参考。这是我在这里上传的第一个模型,欢迎提供反馈。

感谢所有致力于Stable Diffusion模型和LoRA相关工作的人,你们真正承担了绝大部分艰苦工作。


要开始生成提示,请先使用Pony的基础质量触发词:

  • score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up,

然后输入你希望出现在图像中的内容或元素。

如果你使用了全部这些触发词,模型会生成更多细节,因为Pony正是基于这些词进行训练的。关于score标签的更多信息,请参阅文章:

什么是score_9,如何在Pony Diffusion中使用它

https://civitai.com/articles/4248

你也可以省略较低分的标签,混合使用,例如我通常使用的组合:

  • score_9, score_8_up, score_8, score_9

  • score_9, score_8_up, score_7_up

等等,根据你想要的质量或风格进行调整。如果图像看起来缺失某些内容,可能是因为排除了低分标签所致。

对于较长的提示词,有时可以适当提高某些词的强调权重,例如:

  • (detailed:1.2)

此例中,括号内词语的权重将增加1.2倍,使模型更频繁聚焦于这些内容。

由于这是Pony基础模型,你还可以使用以下数据选择标签:

  • source_pony
  • source_furry
  • source_cartoon
  • source_anime

以及评分标签:

  • rating_safe
  • rating_questionable
  • rating_explicit

还有:

  • censored
  • uncensored

角色、风格和艺术家标签同样有效,但因本模型的“基础风格”已发生改变,据我经验,模型绘制艺术家和风格的方式也会有所不同:

  • 某些风格表现更差,因为训练数据部分丢失;
  • 某些风格质量更高,但失去了原艺术家的风格,因为模型倾向朝自身风格扭曲,而非还原原作格式/风格;
  • 某些风格仍与之前一致(可能也包含在其他模型中)。

使用LoRA时,若发现高强度(如>0.8)下出现异常,可先将强度降至0.5,观察是否仍有异常,以及LoRA的概念是否仍适用,再根据效果调整强度。

此外,如果你使用CFG Scale=7,可以尝试降低至CFG Scale=5,这可能修复或改善问题。

有些LoRA在0.8甚至1.0强度下仍能正常工作。

但我认为,由于模型已“远离”基础Pony,部分原本在其他Pony模型中表现良好的LoRA在此模型中可能出现问题。


对于负面提示,你(希望)不需要像使用基础Pony那样大量使用。其他模型已在此方面有所改进,“训练差异”方法已将这些改进整合进本合并模型。

负面提示仍可正常使用,但它们也可能影响图像构图,因此建议自行尝试。

我个人通常从空的负面提示开始,以利用模型的训练风格;之后再逐步过滤或调整构图/质量/风格,例如添加一些本不该出现在图像中的词,以改变构图。

以下是一些有用的负面提示词。注意:部分词会强制改变风格。

如何避免真实人脸:

  • (realistic, lip, nose, tooth, rouge, lipstick, eyeshadow:1.0)

如何避免过于健壮的体型:

  • (abs, muscular, rib:1.0)

如何避免背景虚化(Bokeh):

  • (depth of field, bokeh, blurry:1.0)

如何移除马赛克与审查:

  • (censored, mosaic censoring, bar censor, convenient censoring, pointless censoring:1.0)

如何移除脸红:

  • (blush, embarrassed, nose blush, light blush, full-face blush, shame, ashamed, shy:1.0)

如何移除部分NSFW效果:

  • (trembling, motion lines, motion blur, emphasis lines:1.0)

如何移除双肚脐(使用Euler a和高分辨率修复时可能出现):

  • (double bellybutton)

如何移除水印等:

  • (watermark, signature, text font, username, error, logo, words, letters, digits, autograph, trademark, name:1.0)

部分LoRA是在纯白背景上训练的,若要移除此类背景:

  • (simple background, white background:1.0)

尺寸与宽高比

1024 x 1024 1:1 正方形
1152 x 896 9:7
896 x 1152 7:9
1216 x 832 19:13
832 x 1216 13:19
1344 x 768 7:4 横向
768 x 1344 4:7 纵向
1536 x 640 12:5 横向
640 x 1536 5:12 纵向

其他介于以上数值之间或高达1440的尺寸也可使用,但人物形状可能变形或肢体拉长。

还需注意,部分LoRA是针对特定宽高比训练的,因此在这些比例下表现更佳。

有时微调分辨率会改变内容的呈现方式,尤其当提示词过长/复杂、而当前分辨率空间不足时。

同样,添加本不该出现在图像中的负面词,也会以不同方式影响构图——有些影响大,有些影响小。

示例图像均使用SD Forge生成:https://github.com/lllyasviel/stable-diffusion-webui-forge

此模型生成的图像

未找到图像。