Escape XL (Pony)

详情

模型描述

我希望自己还没错过风景比赛的截止时间……

介绍我的全新 EscapeXL 模型! 该检查点是基于 PonyXL 的微调版本,旨在恢复其生成惊艳风景与细致地貌的能力,并能与你的角色完美融合。它最初是以 LoRA 形式训练的,但使用 Lightning 权重进行标准微调后,效果显著提升。该模型约使用了 200 张图片进行训练。

它同样兼容你喜爱的 PonyXL LoRAs!

本模型目前处于测试阶段,尚未完美,但为参与风景比赛而提前发布,因其在风景生成方面表现优异,而在角色与 NSFW 内容方面仅属普通。如果大家喜欢,我将基于 1000 张以上图片、新增概念,以及更佳的自然语言支持,训练 v1.0 版本,助你描绘出最棒的风景与场景。

v1.0 待办事项:

  • 更多生物群落:太空、水下、室内、城市等……

  • 更多非人物概念:载具、建筑、物品等……

  • 可能增强对风景自然语言描述的支持,以及 Booru 标签支持。

  • 修复解剖结构问题与 PonyXL 原有“遗忘的知识”。最终目标是使该模型能出色地同时处理角色与风景的构图。

  • 欢迎提出建议!

如何使用本模型

只需下载检查点文件并放入你的检查点文件夹(Stable Diffusion)中。

推荐的推理(图像生成)参数如下:

Clip Skip: 2

采样器: DPM++ SDE

步数: ~15

CFG Scale: ~2.0

正向提示词:

score_9, score_8_up, score_7_up, score_6_up, <你的提示词>

负向提示词:

score_6, score_5, score_4

风景触发词:

  • scenery(风景)

  • landscape(景观)

  • no humans(无人物)

本模型在一定程度上能理解自然语言提示。

对于人物与角色图像,建议降低 CFG 和步数。

注意事项

请注意,本检查点在人物与角色图像上的训练数据极少,因此可能保留与基础 Pony XL 模型相同的“狂野风格”问题!为确保稳定性,建议配合你的 LoRA 使用。此外,与其他 Pony 衍生模型相比,它在处理 NSFW 内容或复杂姿势方面并不出色,这些问题有望在 v1.0 中解决。

技术规格

在 1xA40 上训练

关于项目与动机的更多信息

PonyXL 是一个卓越的检查点,擅长描绘复杂人物与情境,其对人体解剖的理解使其成为 NSFW 场景的最佳模型之一。然而,其训练数据集似乎主要聚焦于人形角色的呈现。大规模的微调可能部分“抹去”或替换了基础模型最初习得的概念。此外,文本编码器的初始训练很可能已被大幅修改,以至于现在仅能理解 Booru 标签(或至少 50% 倾向于这种描述语法)。

因此,不借助 LoRA 或其他扩展,仅用 Pony XL 表达角色以外的内容有时极为困难。即使单独使用基础模型,也极难生成连贯且美观的风景画面。

本项目的目标,正是在保留 Pony XL 已有能力的基础上,赋予其描绘风景、生物群落、夜景、载具、物品等概念的能力,并提升整体场景而非单一角色的权重。这显然带来巨大挑战:

  • 如何避免损害模型当前的能力?

  • 如何确保模型与原版足够接近,以兼容为 Pony 设计的 LoRA?

我将通过这个模型尝试回答这些问题。目前它尚不完美:模型在环境表现上更优,但有时出现过拟合,且在解剖处理上不如 Pony XL。下个版本将好得多。

本模型无任何担保。请勿用于不当用途。

提示:

多数细微问题(例如眼睛)可通过局部重绘(inpaint)或高分辨率修复轻松解决。

此模型生成的图像

未找到图像。