Taikaponi
详情
下载文件
关于此版本
模型描述
这是一个基于Pony的检查点合并模型,采用“训练差异”(Train Difference)方法针对不同的检查点和LoRA合并进行训练,而非常规的直接合并。
LoRA并未直接应用于检查点,而是将模型“训练”为趋向于其他检查点。
目标是提升“基础质量”并改变Pony的原始“本征”风格,使其在更少使用负面提示的情况下生成更优图像。
然而,我注意到一些使用“基础Pony”训练的LoRA也继承了其绘图风格,因此当应用于本模型时,会扭曲其绘图风格。
本模型基于Pony基础,因此所有相关标签和提示均可正常使用;但由于是合并模型,部分功能可能在过程中出现异常。
我用它创作得很开心,因此想分享出来,供他人参考。这是我在这里上传的第一个模型,欢迎提供反馈。
感谢所有致力于Stable Diffusion模型和LoRA相关工作的人,你们真正承担了绝大部分艰苦工作。
要开始生成提示,请先使用Pony的基础质量触发词:
- score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up,
然后输入你希望出现在图像中的内容或元素。
如果你使用了全部这些触发词,模型会生成更多细节,因为Pony正是基于这些词进行训练的。关于score标签的更多信息,请参阅文章:
“什么是score_9,如何在Pony Diffusion中使用它”
https://civitai.com/articles/4248
你也可以省略较低分的标签,混合使用,例如我通常使用的组合:
- score_9, score_8_up, score_8, score_9
或
- score_9, score_8_up, score_7_up
等等,根据你想要的质量或风格进行调整。如果图像看起来缺失某些内容,可能是因为排除了低分标签所致。
对于较长的提示词,有时可以适当提高某些词的强调权重,例如:
- (detailed:1.2)
此例中,括号内词语的权重将增加1.2倍,使模型更频繁聚焦于这些内容。
由于这是Pony基础模型,你还可以使用以下数据选择标签:
- source_pony
- source_furry
- source_cartoon
- source_anime
以及评分标签:
- rating_safe
- rating_questionable
- rating_explicit
还有:
- censored
- uncensored
角色、风格和艺术家标签同样有效,但因本模型的“基础风格”已发生改变,据我经验,模型绘制艺术家和风格的方式也会有所不同:
- 某些风格表现更差,因为训练数据部分丢失;
- 某些风格质量更高,但失去了原艺术家的风格,因为模型倾向朝自身风格扭曲,而非还原原作格式/风格;
- 某些风格仍与之前一致(可能也包含在其他模型中)。
使用LoRA时,若发现高强度(如>0.8)下出现异常,可先将强度降至0.5,观察是否仍有异常,以及LoRA的概念是否仍适用,再根据效果调整强度。
此外,如果你使用CFG Scale=7,可以尝试降低至CFG Scale=5,这可能修复或改善问题。
有些LoRA在0.8甚至1.0强度下仍能正常工作。
但我认为,由于模型已“远离”基础Pony,部分原本在其他Pony模型中表现良好的LoRA在此模型中可能出现问题。
对于负面提示,你(希望)不需要像使用基础Pony那样大量使用。其他模型已在此方面有所改进,“训练差异”方法已将这些改进整合进本合并模型。
负面提示仍可正常使用,但它们也可能影响图像构图,因此建议自行尝试。
我个人通常从空的负面提示开始,以利用模型的训练风格;之后再逐步过滤或调整构图/质量/风格,例如添加一些本不该出现在图像中的词,以改变构图。
以下是一些有用的负面提示词。注意:部分词会强制改变风格。
如何避免真实人脸:
- (realistic, lip, nose, tooth, rouge, lipstick, eyeshadow:1.0)
如何避免过于健壮的体型:
- (abs, muscular, rib:1.0)
如何避免背景虚化(Bokeh):
- (depth of field, bokeh, blurry:1.0)
如何移除马赛克与审查:
- (censored, mosaic censoring, bar censor, convenient censoring, pointless censoring:1.0)
如何移除脸红:
- (blush, embarrassed, nose blush, light blush, full-face blush, shame, ashamed, shy:1.0)
如何移除部分NSFW效果:
- (trembling, motion lines, motion blur, emphasis lines:1.0)
如何移除双肚脐(使用Euler a和高分辨率修复时可能出现):
- (double bellybutton)
如何移除水印等:
- (watermark, signature, text font, username, error, logo, words, letters, digits, autograph, trademark, name:1.0)
部分LoRA是在纯白背景上训练的,若要移除此类背景:
- (simple background, white background:1.0)
尺寸与宽高比
1024 x 1024 1:1 正方形
1152 x 896 9:7
896 x 1152 7:9
1216 x 832 19:13
832 x 1216 13:19
1344 x 768 7:4 横向
768 x 1344 4:7 纵向
1536 x 640 12:5 横向
640 x 1536 5:12 纵向
其他介于以上数值之间或高达1440的尺寸也可使用,但人物形状可能变形或肢体拉长。
还需注意,部分LoRA是针对特定宽高比训练的,因此在这些比例下表现更佳。
有时微调分辨率会改变内容的呈现方式,尤其当提示词过长/复杂、而当前分辨率空间不足时。
同样,添加本不该出现在图像中的负面词,也会以不同方式影响构图——有些影响大,有些影响小。
示例图像均使用SD Forge生成:https://github.com/lllyasviel/stable-diffusion-webui-forge




















