Experience SDXL

详情

模型描述

阅读说明

Experience 的 SDXL BETA 版本。

"现在拥有16倍的空间臀部" —— Todd Howard

重要提示:对于 ExperienceXL_v2_BETA,我建议使用 fp16 版本。完整模型仅上传以确保模型哈希与示例图像匹配。


问题/反馈/更新

访问我在 Unstable Diffusion Discord 上的帖子

请我喝杯咖啡 ❤

https://ko-fi.com/ndimensional

所有捐赠将用于资助新的 Stable Diffusion 微调模型和开源 AI 工具的开发。


关于

这不是 Experience 针对 SDXL 的完整发布版本。完整模型仍在训练中,预计将于五月左右完成。

BETA 版本是微调过程中的最新 Epoch 之一——轻微合并了一个动漫模型,以填补早期 Epoch 缺失的细节。

Experience SDXL (BETA) 与 Experience SD1.5 的区别

  • 非写实风格:这是两种架构之间的主要区别,也是完整版本尚未发布的原因。SDXL (BETA) 版本更接近 Experience 在 SD1.5 上的早期版本。其“写实”风格更像是实时渲染,而非摄影或电影画面。使用 SDXL (BETA) 模型很难获得与摄影/电影同等的皮肤细节与纹理表现。完整的 SDXL 模型将具备真正的摄影与电影级表现能力。

  • 更新Main 及后续版本已具备写实能力。

  • 少即是多:使用 SDXL (BETA) 版本时,无需在提示词中写一篇短文。尝试用简单的形容词修饰关键词,例如:'一个 令人叹为观止的 景观','一座 超凡脱俗的 巨型结构'。

  • 使用你偏好的提示风格:SDXL 的一大优势在于其强大的文本编码器,支持自然语言提示。基础模型的所有标注均由我的 MLLM 标注系统生成(更多详情请见我的 Discord 帖子),采用自然语言格式。但你也可以使用 SD1.5 的逗号分隔关键词法或 Booru 标签法,或像对人描述图像那样直接描述。

  • 提示遵循度更高:SDXL (BETA) 版本更可能生成与你的提示高度一致的图像。

  • 风格与媒介:除前述摄影与电影表现的局限外,SDXL (BETA) 版本在生成风格与媒介种类上优于 SD1.5 版本。最佳实践是在提示开头加入媒介或风格描述。若同时包含媒介与风格标记,请将媒介置于提示开头,风格标记置于结尾。

  • 更高分辨率:由 SDXL 本身特性决定。


使用方法

注意:需要 VAE,可从 此处 获取。或从此页面下载。

VAE 路径(Automatic1111-Webui):

配置路径(Automatic1111-Webui):

更新:版本 >= Main 不再需要自定义配置文件。

推荐生成参数

[采样器|步数|CFG]

  • Euler a | 步数:30 | CFG:7

  • DPM++ 2M SDE Karras | 步数:30+ | CFG:7 - 8

高分辨率修复

  • 未测试:我本人在推理时基本未使用高分辨率修复,仅在误开启时少量使用。

扩展插件

  • ADetailer:更多详情请见 GitHub

以上仅为我的推荐参数,可自由使用你的偏好值或尝试新参数。


更新日志

2024/4/27 Experience_v4 (Main)

  • 显著提升写实能力。

    • 提示建议:将你希望生成的媒介置于前五个词内。
  • 模型不再需要自定义配置文件。

  • 春季大扫除 🧹

    • 最新模型版本命名为 "Main",以便 Civitai 重命名文件后仍保持清晰可辨。最新版本将始终名为 "Main"。

    • 模型页面标题中移除了 "BETA"。

      • 注意:模型仍在训练中,此非最终版本。
    • 待办事项:

      • 为各模型版本添加简短说明。

      • 更新主页以反映最新版本状态。

————————————————————————————————————————

2024/4/22 Experience_v2_BETA

  • 写实能力略有(极轻微)提升。

    • 该模型仍不具备写实能力。

    • 在提示开头添加 Cinematic Still Frame,并在结尾添加与电影/摄影相关的标签,并使用自然语言。

  • 对文本编码器进行调试,无显著改动,更多详情即将公布。

  • 尝试改善模型的提示偏见。

    • 例如:在提示中包含用于 3D 渲染的 Booru 标签时,不再因使用 booru_style_prompting 而过度偏向动漫风格。

    • 远未完善,仍需进一步研究文本编码器架构及其对最终输出的影响。

  • 提升提示遵循度(模型输出与提示的一致性)。

  • 整体保真度提升。


查看我的其他模型

SDXL

LoRA SDXL

SD1.5

LoRA SD1.5

此模型生成的图像

未找到图像。