ChromeShineXL

详情

下载文件

模型描述

(如果你在PixAI上使用此模型,推荐参数很可能很糟糕。我无法控制别人在导入时设置了什么,抱歉。)

本模型基于MIX-GEM-XL开发,属于“月度风味”风格混合体。该模型的主要设计目的是结合明亮动态的光线、优质的背景以及非常规的提示词,例如半人马或安卓少女。

ChromeLightXL 是本模型的风格提取器。据我观察,它能保留模型约55%至70%的风格特征,但体积小得多,可与各种其他基础模型组合使用,这样你就不必更换自己钟爱的基础模型(即使你打算一直使用基础小马或AutismMix直到世界尽头)。

版本

目前有两个版本:原型版(proto)和量产版(MP)。命名方式借鉴了高达系列,其中“原型机”更强大,但更难使用,功能限制也更多。具体区别如下:

  • chromeshinexl_proto: 此版本更独特,保留了更多ChromeShineXL的鲜明特质。在肤色与纹理处理上,其表现普遍优于MP版本;在角色构图方面也更为出色。然而,它的提示词遵循度较低,背景效果较差,对使用脏数据集的LoRA处理能力极差。如果你使用的LoRA未彻底清除水印、签名或Patreon/微博/推特标识,这些内容必定会出现在生成图像中。

  • chromeshinexl_MP: 此版本独特性较低,但稳定性更强。它对脏数据集LoRA的处理能力更好(虽非完美),提示词遵循度也显著提高,这意味着它能更准确地响应你的实际提示(例如,对dynamic_posing这类标签的效果尤其明显)。但这不意味着它一定能生成更好的图像——如果你的提示词本身很差(包含大量矛盾标签、拼写错误、无效标签,或加入大量你其实并不需要的摄影/灯光术语),生成结果可能反而更糟。此外,它在服装与背景的连贯性上也更准确。

如果你问我推荐哪个版本,我认为这取决于你的具体使用场景:你是想依赖模型本身的内在知识,还是打算大量叠加角色/服装LoRA?你想要一个反复“自以为是”、有时确实比你更懂的难搞模型,还是一个听话、即使它知道更好的情况下也会服从你指令的模型?无论如何,最终结果才是最好的证明。请查看示例图像,选择更适合你需求的版本。

提示词使用

这是一个基于标签的模型,你应该优先使用标签,仅在必要时辅以自然语言。如果你不熟悉该模型响应的标签类型,大多数动漫风格模型的训练数据均来自Danboorue621。这两个网站均提供详尽的标签维基,可作为你的参考指南。

无论如何,请避免在AI提示中使用主观性词汇。这是我经常观察到的现象:像best qualityhigh qualityvery aesthetic,或score_9score_8score_7_up这类标签,并非AI天然理解的概念,而是通过训练被注入模型的限定词(通常基于用户评分指标,因为我们凡人无法逐个评估数以百万计的艺术作品质量)。AI的黄金法则是:它只认识你喂给它的东西。(这也意味着像beautiful womanperfect face这样的标签若未在训练时被标记过,就完全无效——而鉴于数据源和自动标签器的局限性,这种情况极不可能发生。)

至于负面提示词,由你决定。最佳方案当然是通过多次在相同种子下逐步修改负面提示来优化,但若你没有无限时间,以下是一些有用的负面标签:low qualityextra digitsartistic errorwatermarkartist namesignaturee621_p_low是一个内建的通用负面质量标签,其标记数比score_6score_5score_4更少。如果你不信任它,也可以选择完整质量标签链,但在我看来,它是个更优的替代方案。预览图可作为参考,当然你也可以自由调整自己的负面提示。

采样与其他参数

如同所有扩散模型,负向提示词的效果会随“无分类器引导尺度”(CFG)的提高而增强。虽然提示词决定文本编码器如何调节潜在空间,但CFG调节的是这种影响的强度。要完全解释提示词如何引导潜在空间需要大量文字,简而言之:无条件条件(负向提示)会抑制某些向量被应用到潜在空间,CFG值越高,这种抑制就越强(同时正向提示的引导力也越强)。当然,过高的CFG容易因过度影响去噪过程而导致图像“烧毁”。我的建议是:要么使用Perturbed Attention Guidance (PAG)增强引导效果而不提高CFG,要么使用Dynamic Thresholding CFG在早期步骤中限制CFG。

我推荐的采样器是Euler A,搭配你最喜欢的调度器。对我而言,SGMUniform表现最好(且速度最快),但有人报告更喜欢AYS采样器。我个人使用AYS时发现,它在大多数情况下更贴近提示词,但也会放大模型因数据清洗不足而学到的一些不良特质,偶尔会注入文字或水印。如果你愿意尝试更冷门的采样器,我发现Euler dy Negative采样器特别干净。主观上它“野心”不如Euler A,但生成结果简洁、清晰、干净。

我推荐步数为25-35步,我的默认值是28。坦白说,不建议超出此范围。对于非收敛采样器(如随机采样器和祖先采样器),增加步数会显著改变图像;而对于收敛采样器,一旦超过35步,提升效果微乎其微,纯粹浪费计算资源。更好的解决办法是调整其他参数(例如提示词),而非假定增加步数就能修复问题。

该模型在832x1216或768x1344分辨率下表现最佳。

此模型生成的图像

未找到图像。