ZootVision - Eta

详情

模型描述

这是什么?

我会这样描述它:这是一个异常多才多艺的 SD 1.5 模型,其所有自定义训练均 exclusively 在 1024px 及更高分辨率下完成(得益于“分桶”技术)。该模型通过 CivitAI 方便的在线 LoRA 训练器,以干净、逐步、迭代的方式持续构建。它可以处理从美丽的风景到基于 hardcore booru 标签的 NSFW 内容,几乎涵盖任何风格。它并非专为动漫、写实或半写实风格设计的特定检查点,而是你希望它在任何时候呈现哪种风格,它就能成为哪种风格。所有展示图均为直接生成,未使用任何细节增强或超分辨率处理(即使用时应将其视为 XL 模型),并包含完整元数据。

如何使用它?

你可以使用自然语言或 booru 标签(用空格分隔,而非下划线)。我通常同时使用两者,即用基本连贯的语句,但其中许多词和短语是真实存在的具体标签。请参阅展示图库获取各种示例。就分辨率而言,在我看来,使用此模型时,任何低于 768x768 的分辨率都是完全无意义的(因为我的全部训练都在 1024px 下进行,从未进行过降采样或裁剪)。

我个人从不低于 1024x768 或 768x1024 的分辨率生成图像,在非正方形图像中,我更常使用 1216x832 和 832x1216。对于正方形图像,我坚持使用 1024x1024。再次强调,你可以下载我展示图像的原始分辨率版本(含完整元数据),以更好地了解这个模型的能力——因为它还训练于一些较不常见的“异形”宽高比/分辨率。

此外,如果你在提示中追求 2D 风格图像,此模型确实能识别大量“by whoever”风格的艺术家标签(部分效果更强),因此若有你想到的标签,不妨直接尝试。

提示:总体而言,若追求写实效果,SDE 采样器在此模型上表现更优。我个人非常偏好 DPM++ 3M SDE GPU Exponential,CFG 值设为 4.0 - 4.5 左右。而对于非写实风格,你也可以尝试 Euler Ancestral(偶尔用 DPM++ 2M Karras),CFG 值设为 7.0 左右。

“masterpiece, best quality, high quality, worst quality” 等关键词在本模型中有效吗?

是的,但它们对图像的影响在追求写实或半写实时显著减弱,其影响最明显地体现在 2D 风格图像上。不过,detailed backgroundsimple background 这两个关键词,在各类图像中均具有你预期的明显效果。

V7.0 Eta 详情:

写实效果和提示一致性达到了前所未有的最佳水平。我对这个版本非常满意。VAE 一如既往已内置。

V6.5 Zeta Plus 详情:

它尚未完全达到 Zootvision V7 Eta 的目标,但仍带来了一些不错、或许较为细微的改进。这次我在展示图库中更加强调了模型的深度表现力。VAE 一如既往已内置。

V6.0 Zeta 详情:

实际上,几乎所有方面都得到了改进。我实现了我在评论中提到的所有内容,还做了更多。为了更充分展示这个模型的能力,我还特意生成了一些相当怪异的展示图,哈哈。VAE 一如既往已内置。别忘了,本模型确实精通大量 by whoever 格式的 booru 艺术家标签,不只是我之前提到的那几个!

V5.0 Epsilon 详情:

在 v4.0 Delta 基础上,针对多种主题(包括写实、NSFW 和动漫)额外训练了 10,000 步。此版本还引入了 Ideogram 风格数据集,可通过在任何提示中使用 'by ideogram' 来触发。请参阅展示图库中的示例。我认为这比 Delta 有显著进步,希望你喜欢!VAE 一如既往已内置。

V4.0 Delta 详情:

合并了两个新增数据集(一个用于进一步提升人像与场景的摄影图像,另一个用于实验性“复杂提示”丰富标注),二者均基于 V3.0 Gamma 训练,累计达 9040 步。VAE 一如既往已内置。所有新摄影数据集中的图像均标注了 photo \(medium\),以强化模型对这一标签的现有理解。这无疑是迄今为止最好的版本,希望你喜欢!

V3.0 Gamma 详情:

合并了 1000 张图像的“美学”数据集(基于 V2.0 Beta 训练 10,000 步)。你可在提示中任意位置使用短语 very aesthetic 来增强该数据集的效果。此版本已如常内置 VAE。

V2.0 Beta 详情:

合并了 1000 张图像的“NSFW 增强器”数据集(基于 V1.0 Alpha 训练 10,000 步)。所有图像在至少一侧的分辨率不低于 1024px,最高达 1216px(包含大量 XL 风格的 832x1216 竖图与 1216x832 横图)。

V1.0 Alpha 详情:

这是我尝试构建一个真正通用、专注于高分辨率的 SD 1.5 模型的(未完成)努力,涵盖从美丽风景到基于 booru 标签的 hardcore NSFW 内容。

目前上传至 CivitAI 的主要目的,仅是为了利用其 LoRA 训练器,以训练并合并我后续需要的几个 1000 张图像的数据集。尽管如此,你仍可自由尝试(它认识许多角色,例如展示图中的 Jinx),但请注意,其结果与后续/最终版本相比会有显著差异。

通用(始终相关)说明:

请勿盲目假设 Clip Skip 2 对此模型总是“正确”的,它并非传统上源自 NAI。我更推荐你在找到某个你基本满意但尚未完美的种子时,分别尝试 Clip Skip 1 或 2 —— 在我的测试中,两者在不同情境下均能产生良好效果。

此模型生成的图像

未找到图像。