Karmix-XL v0

详情

下载文件

模型描述

Karmix-XL v0

Karmix-XL v0 是一个基于 SDXL(Epsilon-预测)的实验性动漫风格文生图模型,专注于高分辨率潜在空间支持、风格灵活性,以及对从 Danbooru 标签到自然语言等不同提示结构的解读能力。

示例图像展示了模型在不同提示下的能力。

注意:这些结果为原始文生图输出,未应用 Hires.fix、AfterDetailer、Inpaint 等后处理。肖像分辨率为 1280x1856,风景为 1536x1024。

所用软件为 ComfyUI,上传的图像中包含工作流元数据。

模型描述

本模型使用 Karcher 均值 合并方法创建,具体基于 win10ogod 开发的修改版脚本。

该模型融合了以下三种模型:

  • 1536x1536 基础模型(Illustrious-XL 2.0)
  • 1536+1024 混合模型(Illustrious + NoobAI)
  • 1024x1024 基础模型(基于 NoobAI 1.0 训练的 OD39_E60)

源代码:

用于本次合并的修改版源代码请见:

https://github.com/chemwolf118/Karcher-merge

合并配方(v0)

合并时使用了以下 alpha 比例:

模型组件 | 比例(Alpha)

  • hesperidesIllustrious_v10 | 0.23

  • illustriousXLPersonalMerge_v30Noob10based | 0.23

  • illustriousXL20_v20 | 0.23 | CivitAI 版本

  • OD39_E60_fp16 | 0.31

详细参数:

本模型使用 karcher-iter 30karcher-tol 1e-7 进行合并,各层权重如下:

--alphas 0.23 0.23 0.23 0.31

--alphas-te 0.28 0.18 0.18 0.36

--alphas-unet-in 0.15 0.24 0.15 0.46

--alphas-unet-mid 0.15 0.24 0.15 0.46

--alphas-unet-out 0.28 0.18 0.18 0.36

使用与建议

重要提示: 此模型为实验版本(“v0”),在不同分辨率、采样器设置及艺术家标签组合下,可能表现不一致。

分辨率与采样器

模型支持高分辨率潜在生成(最高达 1856px)。

已测试分辨率1280×18561856×1280 及标准 1024x15361536x1024

注意:某些情况下可尝试 1536x2048 和 2048x1536,但仅极少数提示有效。

🚧 模型限制与性能说明

尽管模型可直接生成 1280x1856 分辨率图像,但在如此高分辨率下仍存在质量限制与细节问题。

由于本模型融合了多个基于 NoobAI 的模型(其原始训练分辨率为 1024 而非 1536),在使用 middle finger/full body 等标签时,部分姿势或角度可能导致人体比例拉长。

此外,已知在使用 Euler 采样器时,风景模式下可能出现人体结构断裂。

使用场景 | 推荐采样器 | 调度器 | 说明

  • 肖像 | Euler | Normal | 通常表现良好。

  • 风景 | DPM++ 2M3M | sgm_uniform | 关键:在高分辨率风景图(如 1856x1280)中使用 Euler 采样器常导致结构断裂。

推荐设置

  • 分辨率/宽高比:肖像使用 1024x1536 至 1280x1856,风景使用 1536x1024

  • CFG:3.5–5(推荐 4.0–4.3)

  • 步数:28–30

  • 采样器:Euler

  • 调度器:Normal

提示风格

Karmix-XL v0 支持多种提示结构,可自由组合:

1. Danbooru 标签

标准标签式提示。

> 1girl, solo, cat_ears, maid, white apron, smile, looking at viewer, indoors

2. 自然语言

类似标准 SDXL 的描述性语句。

> The anime depicts an adult woman with long black hair, leaning on the balcony railing at night, city lights in background.

3. 混合:自然语言 + 艺术家标签

用自然语言描述场景,用标签指定风格。

> Scene with a beautiful anime girl with white hair and red eyes, intricate dress. artist:konya_karasue

4. 复杂混合

可组合所有方法:

> A cinematic shot of a warrior girl, forest background. 1girl, armor, sword, holding weapon. yao liao wang,xilmo, (fkey:0.5), meinoss,dikko

提示备注:若使用特定艺术家昵称标签(如 tanti_men_(dragon) 导致出现龙,chuck_(harfmoondark) 导致出现 chuck_(pokemon))时出现无关生物或物体,请改用 artist: 前缀,例如 artist:chuck_(harfmoondark)

版本历史

  • v0 - 创建于 2025 年 4 月 23 日,上传至 HuggingFace 于 2025 年 4 月 28 日 | 链接

    • 首次发布。
  • v0-CivitAI - 上传于 2025 年 12 月 5 日

其他版本

其他采用不同合并方法/参数的实验版本请见:

https://huggingface.co/NullAxis/karmix-merge-experiments

(注意:这些版本为原型,不代表未来主版本的最终质量。)

NullAxis 是一个为开展 Karmix 及多种模型融合实验而成立的组织,现已拥有网站 nullaxis.dev 相关活动信息(包括现有成果与未来计划)将在此发布。

致谢

特别感谢以下贡献者与开发者,他们的工作、建议与支持使本项目成为可能:

  • su momo — Karcher-merge 脚本改进的主要贡献者,提供指导与帮助。

  • win10ogod — Karcher-merge 方法脚本作者,Karmix 模型基于此创建。GitHub | HuggingFace

  • 乙酰胆碱 — Karmix 中使用的精美模型 OD39_E60 的作者。

  • DammK YaZuXaWa — 提供 win10ogod 的 Karcher-merge 方法原始信息及过程中的各种协助。GitHub | HuggingFace | CivitAI

  • Kurosu Chan — 协助解答各类问题,并对 Karmix 初稿进行评估。GitHub | Gist | HuggingFace

  • Stable Diffusion CN — 感谢整个 SDCN 社区的全部支持。

  • Laxhar Lab — 提供 NoobAI XL

  • OnomaAI — 提供 Illustrious XL

  • bloodsplash — 提供 Hesperides XL v1.0 | CivitAI

  • dims2 — 提供 Illustrious XL personal merge v3.0 | CivitAI

  • 及其他 — 社区支持与测试。

原始文章现已归档,相关信息将统一更新于 HuggingFace 模型卡片中。

如有任何问题、建议或需要反馈,请在 HuggingFace 创建讨论,或发送邮件至 [email protected]

许可证

本模型发布于 Fair AI Public License 1.0-SD(Illustrious 许可证)

同时,模型整合了来自 NoobAI 的组件,其具有独立的使用条款。请确保同时遵守以下两项许可:

Illustrious 许可条款https://freedevproject.org/faipl-1.0-sd

NoobAI 许可条款https://huggingface.co/Laxhar/noobai-XL-1.0/blob/main/README.md#model-license

此模型生成的图像

未找到图像。