[SD1.5] ColorSplash - V-prediction Vibrant Anime Mix

详情

模型描述

警告:此处有龙!

此模型的CLIP与模型工具包不兼容。请勿使用模型工具包检查或修剪此模型,因为这样做将不可避免地破坏模型本身。更多信息请参阅 本文

此外,此模型使用zSNR和V预测。请下载.yaml配置文件并将其放置在模型所在文件夹中(适用于A1111/Forge);或在ComfyUI中使用ModelDiscreteSampling节点

此模型是什么?

ColorSplash(先前在预览图中名为ColorStorm,现已重构以获得更好的效果)是一个基于Stable Diffusion 1.5的合并模型,旨在测试在不显著损失质量的前提下能否融合V预测。目前仍处于开发中,我正在努力使其正常运行。

如何使用此模型?

提示词(Prompting):

此模型(在我的测试中)非常擅长使用booru标签,但极少能有效使用自然语言

此模型难以通过提示词影响风格。当提示词较短时,模型输出清晰锐利;但随着词语增多,输出会变得扭曲。为缓解此问题,强烈推荐使用高分辨率修复(Hi.res fix)

与大多数动漫检查点一样,此模型也存在女性偏向,但可通过调整加以克服。

此模型主要在ComfyUI的提示词解析器和reForge的默认解析器(配合.yaml配置文件)下进行测试。

角色识别对极其流行的角色效果良好,但其他角色效果有限。9th Tail的角色训练虽已退化但未完全丢失。ConcoctionMix的Hololive和AIOMonsterGirl知识也未完全消失,但同样有所退化。请注意:Suzuran的多条尾巴可能偶尔会显露出来。

此模型在毛茸茸(furry)内容上表现意外地出色,但原因尚不明确……

另外,当涉及合并知识时会出现“棕化”现象(通常使图像偏棕),请谨慎使用。

参数:

加粗部分为经过测试并表现良好的选项)

  • 采样器 + 调度器:几乎所有采样器均可使用,但会出现轻微棕化。最佳方案为**Euler beta、DPM++ 2M beta**,次选推荐:Euler aDPM++ 2M SGM UniformDPM AdaptiveUniPC simple、DDIM (使用ddim_uniform)DPM++ SDE BetaKarras调度器完全不可用,这可能是V预测模型唯一的缺陷

  • 步数:20+

  • CFG:4-12(推荐范围:4-6,7-12可用但会出现伪影),推荐使用RescaleCFG

  • CLIP跳过:1-2

  • 分辨率:测试了3:2长宽比,基础分辨率768及以下(640、512)均可使用

  • 高分辨率修复:强烈推荐。已在1.5倍潜空间上采样中测试

合并配方:

ColorSplash-v0.1

该图完整展示了在ComfyUI中ColorSplash-v0.1的合并配方。使用了comfy-mecha和ComfyUI-DareMerge(未正确使用)。图内包含元数据。

这是一个简单的TIES合并(k=0.9),包含:

  • 模型A:9th Tail - main_v0.3

  • 模型B:ConcoctionMix-a1 [Vodka]

  • 模型C:ConcoctionMix-a2 [Vermouth]

ColorSplash-v0.1.1

V0.1.1仅使用comfy-mecha,因为我完全不需要修改CLIP。

对无法阅读图像者说明:这是一个两步合并,使用四个模型:

  • 模型A:ColorSplash - v0.1(最初是作为ConcoctionMix实验)

  • 模型B:AIOMonsterGirl - v4(更连贯的知识迁移)

  • 模型C:OpenSolera - a6 [Fleur](相同理念)

  • 模型D:FluffyRock Unleashed - v1.0 Base(相同理念)

第一步:使用A-x-A方法训练差异,其中x为模型B、C或D

第二步:使用Dropout进行TIES加和(k=1),然后将其加回模型A

ColorSplash-v0.1.2

此模型生成的图像

未找到图像。