CatWai (merge)

详情

模型描述

澄清:这是一个 epsilon 预测模型,尽管合并中使用的一些模型是 v-预测。

此检查点合并旨在将 v-预测模型 catTowerNoobaiXL 转换为 epsilon 预测格式,同时保留其高质量特性,因此如果你能运行 v-预测模型,也请尝试一下那个模型 : )

v1.5 基于 catTowerNoobaiXL_v15VpredwaiNSFWIllustrious_v90

v1.4 基于 catTowerNoobaiXL_v14VpredwaiNSFWIllustrious_v70

v1.0_fix 基于 catTowerNoobaiXL_v11VpredwaiNSFWIllustrious_v70


这是我首次尝试的检查点合并,一个将 v-预测模型转换为 eps-预测模型的实验性尝试。

它主要基于 catTowerNoobaiXL(v-预测),最终合并为 eps-预测格式,以便你可以在原生 WebUI 中使用。

实现方式是逐步将输出层替换为其他 eps 模型。用于替换的模型为(90% waiNSFWIllustrious + 10% ebara_pony_2.1)。转换后的模型进一步以 9:1 的比例与 waiNSFWIllustrious 合并,粗略来说,约为 70% CatTower + 28% wai + 2% ebara,因此我称之为 CatWai。

合并过程在 ComfyUI 中完成。你可以将模型文件或 json 工作流拖入 ComfyUI 查看详细的合并流程。json 文件可在上传为“训练数据”的 zip 包中找到。使用 ComfyUI 工作流,如果你本地已存在上述三个模型,可节省 6GB 的下载量 : ) 下面也提供了文本版的配方。

非常感谢原始模型作者的贡献,尤其是 catTower 模型,它精良的设计让我再次对 AI 绘画充满热情!本次合并的许可证与 catTower 相同,规定:禁止商业用途

最初我打算将此模型作为 catTower 的一个 LoRA 补丁发布,但失败了。我得到了一些接近的结果,但即使在 dim=conv_dim=512 的情况下,质量下降依然显著。

设置

我是 IL / Noob 新手,因此这个设置可能不是最优的。

正向提示:

masterpiece, best quality, absurdres, safe

负向提示:

lowres, worst quality, low quality, bad anatomy, bad hands, 4koma, comic, greyscale, censored, jpeg artifacts, overly saturated, overly vivid

采样方法:Euler

采样步数:30

分辨率:我个人推荐 1024 x 1536,但更多人使用 832 x 1216

CFG 缩放:5

Clip 跳过:2

配方

v1.4 使用相同的合并流程,其中 catTowerNoobaiXL_v11Vpred 替换为 catTowerNoobaiXL_v14Vpred

v1.5 使用相同的合并流程,其中 catTowerNoobaiXL_v11Vpred 替换为 catTowerNoobaiXL_v15Vpred,waiNSFWIllustrious_v70 替换为 waiNSFWIllustrious_v90

你也可以将模型文件或 json 工作流拖入 ComfyUI 查看详细的合并流程。json 文件可在上传为“训练数据”的 zip 包中找到。

A = 0.9 * waiNSFWIllustrious_v70 + 0.1 * ebara_pony_2.1
B = x * catTowerNoobaiXL_v11Vpred + (1 - x) * A
其中 x 为 [1.0, 1.0, 1.0, 0.7, 0.5, 0.25, 0.1, 0.0, 0.0, 0.0],分别对应 output_block 0-8 及其余输出块;其他块(即 input_blocks + mid_blocks + 其余)x 为 1.0
result = 0.9 * B + 0.1 * waiNSFWIllustrious_v70

许可证

许可证与 catTower 相同:禁止商业用途。

此模型生成的图像

未找到图像。