⋅ ⊣ Realities Edge XL ⊢ ⋅ LIGHTNING + Turbo!

详情

模型描述

阅读“关于此版本”以获取生成信息 -->

  • 新的 V7 同时包含 TURBOLIGHTNING 优化版本——超级快速!

  • 我迄今为止最优秀的 SDXL 模型——简短而直接的提示效果最佳!

  • TURBO V2——在更少的步骤下,质量更好了

  • LCM 更新:每代生成仅需 1-2 秒!阅读“关于此版本”-->

  • 更新了带有 FP16 修复的 VAE,以提升细节表现:https://huggingface.co/madebyollin/sdxl-vae-fp16-fix

  • V.5 已发布!各方面都更好了——尽情享受吧!

  • V.4 已发布!写实效果更佳……再次升级!

  • V.3 需要 DPM+ 3M SDE,且 V3 还拥有全新的更优许可证

  • COMFYUIA1111 之间的图像兼容性——处处一致!此更新会改变种子值,若不进行这些更改,你将无法复现我的图像!更多信息见:https://github.com/Mikubill/sd-webui-controlnet/discussions/2039

↓ 设置与推荐见下方 ↓

简单与复杂并存,该模型在熟练使用者手中极为多才多艺。XL 中更强的写实效果已到来。

⋅ ⊣ 为什么?

无需寻找其他模型。专为 XL 设计的锐利、多功能模型时代已然到来,这在很大程度上归功于这个了不起的社区。本模型建立在 SDXL 1.0 模型所积累的知识与惊人基础之上——感谢 StabilityAI 团队!

但正如许多人所指出的,总有改进空间。本模型旨在将 XL 的生成提升至新的高度,不仅为进一步发展奠定基础,更能生成令人惊艳的图像——无论是照片还是数字艺术。

Realities Edge (RE) 修复了 SDXL 1.0 基础模型 的一些最薄弱环节,特别是细节缺失与纹理不足。有时 XL 基础模型会生成模糊与清晰区域混杂的区域,并且人物偏瘦、解剖结构略微扭曲。面部与种族多样性也有待提升,但相较 1.5 版本已是巨大飞跃。此外,各种艺术风格的表现能力。SDXL 基础模型远超其前辈,为我们提供了巨大的升级空间,但某些艺术风格仍使其捉襟见肘。RE 在这方面做出了显著改进。

SDXL 已向我们所有人发布,现在轮到我们来构建了。

⋅ ⊣ 什么?

通过对 Civitai 上最佳现有模型进行系统性混沌融合*,并结合我过去几周训练的自定义、未发布 XL LoRA,最终诞生了本模型。它具备出色的写实与自然摄影能力,但这只是冰山一角。RE 支持 NSFW 内容,拥有完善的解剖结构信息,并搭配 LoRA 实现更逼真的皮肤纹理、面部、眼睛与嘴唇。针对女性角色的大量解剖修正已基本完善,手部表现也大幅提升,带来惊人的写实感。男性角色仍有改进空间,但以此为基础,我相信相关优化将迅速到来。

Realities Edge 首先且最重要的是一个艺术机器。华丽的油画、氛围感十足的摄影艺术、未来主义 3D、各类数字艺术,以及其间的一切形式。只要人类历史上曾出现过的艺术表达,RE 都能驾驭,或至少为你提供一个坚实基础,以训练自己的作品!借助 SDXL,LoRA 变得前所未有的易用(尽管掌握它仍具挑战 😉)。

RE 拥有丰富的艺术风格选择,其中大多数都能直接输出锐利、鲜艳的效果,如需进一步调整或放大,也极为便捷。插画、矢量、油画、水彩、复古相机(如柯达与伊尔福)风格;产品摄影、概念艺术、微距、人像、动物、漫画、角色、西方风格、东方风格、中世纪风格、D&D 等 RPG 风格、机械部件、外星生物——所有这些皆可自由组合、扭曲、融合,创造出你所能想象的任何混搭风格。

⋅ ⊣ 如何?

本模型大量依赖社区杰出模型制作者 socalguitarist 的 XL 模型,并融合了我自身的大量“酸性”LoRA,用以消除低质量、低分辨率、畸形眼睛和过度柔化的皮肤纹理,同时弥补 StabilityAI 基础模型在创意与风格多样性方面的不足。结合社区训练成果,本模型得以大放异彩。

在最终定型前,已经历约 17 轮迭代。模型通过常规检查点融合(加权求和与差值添加)进行合并,但主要工作由 MBW(块合并)完成。众多 LoRA 均使用 Kohya-ss 训练,维度秩设为 256,以追求最锐利的细节与最高质量,代价是占用大量磁盘空间。

说到磁盘空间,模型总占用约 170GB。

该模型可生成基础动漫风格,但别灰心——在训练过程中,一个独立的动漫 LoRA 由此诞生,计划于八月底发布。但这将是另一篇帖子的内容。

无需使用精炼器

⋅ ⊣ 能力与建议:

  • 写实、3D、2.5D、插画、图像合成、人像等

  • 支持 NSFW

  • 与 LoRA 配合极佳——既可作为训练基础,也可用于渲染

  • 在两种 CLIP 提示方式下均表现出色:无论是开放式的 OpenAI 风格提示,还是极简的故事驱动型 LAION 提示(用更自然的语言撰写,无需频繁使用逗号)

  • 照明效果出色,使用简短提示与激进(但简短)的负面提示效果最佳

  • 即使在较高 CFG 值下,生成烧图的风险极低——推荐 CFG 值为 5.5–15

  • 对 hires.fix 响应极佳,仅需 1.0–1.5 倍缩放甚至更高。我本人偏好不缩放,仅使用锐利的放大器并减少步数。若你的显存充足,可大胆提高缩放倍数!

  • 推荐分辨率范围:768x1344 和 1024x1296。更大分辨率对风景也很有效。也支持变形镜头(如 1920x816 等)。请自行测试最适合你的设置。

  • 推荐使用 DPM+ 3M SDE Karras,但请始终尝试你最喜欢的采样器!

  • 所有 img2img 模式表现优异,使用较低 CFG 值搭配高于平均水平的去噪强度,可借助常规 SD 放大器生成锐利清晰、细节丰富的放大图像。我很好奇你用 Ultimate SD upscale 能做出什么?

  • 偏好 Clip Skip 1–4,我常用 2。

  • 了解部分名人——优秀的 LoRA 基础!

  • 在 A1111 中搭配 ToMe(Token 合并)使用,可大幅加快 SDXL 生成速度——但会改变种子值!(我确信 ComfyUI 也已支持)

* = “混沌融合”(chaoswarp)一词源于大量咖啡与无数个深夜守在电脑前,构思越来越复杂的提示,将风格、故事与角色折叠成精妙图像。在深夜迷雾中,灵感与实验飞速涌现,以至于如今已无法准确回忆起具体步骤。

负责任地生成。

"就像 ReV 和 RV,但为 XL 设计——太棒了!"

- 某位网友

                         ⋅ ⊣ 期待再见 ⊢ ⋅

此模型生成的图像

未找到图像。