kegant

详情

下载文件

模型描述

kegant


工作流(ComfyUI):

✨ v4 ✨ /model/1856037?modelVersionId=2100596

✨ v1-v3: ✨ /model/861472?modelVersionId=963859

如果你不使用 ComfyUI,祝你好运!


V4 更新: V4 大部分基于 V3 的数据集,尽管部分图片被剔除,但最重要的是,它已从 Pony 切换为 noobai-vpred 作为基础模型。因此,请遵循 noobai 训练时所用的规范,使用适当的 Danbooru 标签。如需帮助,请查看我发布的部分图像,注意我通常在提示词开头使用的标签风格。使用 ComfyUI 的主要原因是降低 vpred 模型的饱和度和对比度。虽然展示图均使用了全去噪设置,但强烈建议将主 ksampler 的去噪值调低至 0.8。这是因为 vpred 模型的去噪模式与 eps(或 epsilon 模型)大不相同。此版本尚不完美,可能仍需修正,因为诸如模糊和景深等标签仍存在一定问题。如果效果过强,可在负面提示中加入“blur”或“depth of field”,通常能有效改善。如果你只能使用生成器,无法像我在附带的 ComfyUI 工作流中那样手动调整采样器参数,那么在负面提示中同时加入“red_theme”和“blue_theme”也可能有所帮助。但老实说,如果你正在使用此检查点,最好还是直接采用我提供的工作流,看看我是如何使用的。

需要说明的是,所有展示图均未经过 Photoshop 或 ComfyUI 后期编辑,也未使用 img2img,但我确实使用了面部细节增强器。与之前的 Pony 模型相比,此版本在处理远景镜头(如“full_body”或“wide_angle”)时表现更差,因此强烈建议使用面部细节增强器。V4 工作流中已附带面部细节增强器,设置非常简单,而且运行速度比完整潜空间更快,能显著改善远景人物的面部表现。我使用的是这位作者的指南(效果极佳):
https://www.youtube.com/watch?v=gDBeKIa4sHA


V3 更新: V3 主要是怪物类图像的更新,也包含了一些客串角色,更重要的是,它对艺术元素实现了更精细的控制。我在这版中做了不少极端操作,例如手动用 GIMP 编辑大量源图像,尽可能去除所有 JPEG 压缩伪影。水印已完全清除,无需在负面标签中额外标注;植物与生物的问题也已修复;同时我增加了大量男性角色数据,希望生成男性形象更轻松。要查看本次更新中我所包含图像的完整标签列表,请参见“关于此版本”。V3 中大量图像被打上了非常有力的标签,例如 'film grain, halftone effect, dark fantasy, muted colors, sepia'。我频繁使用这些标签,是因为我所使用的源图像本身就包含这些元素。如果你不希望出现这些效果,只想生成标准动画风格,就把它们加入负面提示。某些风格过于强烈,若无明确提示,可能会自动渗透进来。我新增了一些武器,特别是剑、Guts 的“巨型剑”以及来自 Cis 的 katana(武士刀)。由于 SDXL 的限制,无论提示技巧多好,生成武器始终很困难,但希望新增的 katana 和剑的图像能帮助模型更准确地呈现武器姿势。


V2 更新: V2 是我首次亲自训练并手动调整的版本。它仍主要沿用 V1 的数据集,但部分权重已降低,我新增并训练的图像修正了 V1 存在的一些问题。V2 更侧重于沙漠风格的光影效果,并略微调整了艺术风格:眼睛和嘴唇稍小。本版的光影效果已变得相当夸张,我觉得再进一步调整光影,整个模型可能会崩溃。或许我们可以称其为“kegant 沙漠更新”。


kegant PDXL 是一个基于 Pony 的模型,专注于将 Pony 转变为更具复古感和粗粝感的外观,同时着重强调光影效果。

它主要基于将 5 个独立 LoRA 和 1 个嵌入模型融合进 Ponyv6 模型的“烘焙”版本。这些模型包括:

/model/366990/pony-custom-styles?modelVersionId=454703

/model/341353/expressiveh-hentai-lora-style?modelVersionId=382152

/model/550871/bss-styles-for-pony?modelVersionId=669776

/model/122359/detail-tweaker-xl?modelVersionId=135867

/model/118418/negativexl?modelVersionId=134583

/model/264290/styles-for-pony-diffusion-v6-xl-not-artists-styles?modelVersionId=330475

如果你看不到图片,以下是烘焙时使用的设置:

  • Kenva: .8

  • ExpressiveH: .8

  • GLSHS: .8

  • add_detail: .5

  • negativeXL_D: 1

  • Concept Art Twilight: .3

请注意,该模型在生成女性图像时存在偏好,且更倾向于保持主体既不太远也不太近。生成全身图可能略有困难,但若在提示词中明确指定“shoes”、“boots”或“feet”/“toes”,模型更有可能输出你想要的全身图像。记住——这是一个基于 Pony 的检查点,它更偏好 Danbooru 风格的标签,而非纯英文描述。有时,少即是多。 提示词中堆砌过多标签反而会让模型难以理解意图。如果你重视全身图,请在提示词开头就标注“full_body”,因为提示词越靠前,模型赋予的权重越高。你也可以手动加权,这能进一步提升效果。我所有在该检查点上使用的提示词均公开,如需指导,请参考。

尽管如此,该检查点的灵活性不如 Goat(即 V6),但你用灵活性换来了更强的光影、艺术风格和生成速度。使用所有附加 LoRA 烘焙后的版本生成相同图像集,速度比使用 V6 加完整 LoRA 栈快约三倍——这正是本检查点的主要目标。

✨ 请在下方分享你的精彩创作!✨

非常感谢你们尝试我的第一个检查点。


有关更详细的提示指南,请参阅 Pony V6 模型页面。

☄️ 生成建议

* 所有预览图像均仅使用基础模型生成,仅最后两张额外使用了 Haruko Haruhara 和 Lain LoRA,因为 Pony 模型本身无法识别这些角色,它们是高度风格化的角色,单独提示极难生成。除此之外,未使用任何其他资源,仅通过纯文生图,并仅进行一次潜空间上采样(未使用像素上采样)。

大多数样本图像在初始生成阶段使用了以下类型的祖先采样器:

  • 采样器:Euler A / DPM++A

  • 调度类型:Karras

  • 步数:20 - 30

  • CFG:2 - 6

  • Clip Skip:2

  • 去噪:1

使用的潜空间上采样器设置与上述类似,通常选择 Euler 系列,因为其图像生成速度更快:

  • 采样器:Euler A / DPM++A

  • 调度类型:Karras

  • 步数:15

  • CFG:2 - 6

  • 去噪:0.5

  • 放大倍数:1.5-2.0

关于生成技巧:在潜空间上采样阶段,CFG 值(及步数)越低,图像越接近“绘画感”,特征更柔和、轮廓更模糊,从而产生某些图像中的“雾感”效果。反之,CFG 值越高,图像越“烘焙”和光亮。3.0 的 CFG 值可能是所有 LoRA 间的最佳平衡点,能最充分地突出各自的风格。对于附带的 Harley Quinn 图像,我使用了高达 10 的 CFG 来展示效果,但该效果高度抽象。

请务必查看我附带的工作流,它详细说明了如何最大限度地操控 kegant,无论你偏好流畅光亮的风格,还是柔化复古、带有胶片颗粒的氛围。

最后一点提醒:该检查点倾向于添加“JPEG伪影”以及各类生物元素,例如“植物”和“花朵”,同时也常添加“赛博朋克”元素。如果你不希望出现这些效果,请在负面提示中加入这些关键词,模型通常能很好地移除它们。对于男性角色生成,明确在负面提示中加入“1girl”非常有帮助——尽管如前所述,该检查点明显偏好女性角色。

此模型生成的图像

未找到图像。