RobMix CosXL

详情

下载文件

模型描述

这是一个 CosXL 检查点。 下载前请阅读。

来自 Stability CosXL HuggingFace

“Cos Stable Diffusion XL 1.0 Base 经过调优,采用余弦连续 EDM VPred 调度方案。此调度方案最显著的特征是能够生成从纯黑到纯白的完整色彩范围,同时在每一步图像变化速率上带来更细微的改进。”

在我的早期测试中,CosXL 基础模型已经非常出色,但我希望融合一些我最近的 SDXL 检查点合并成果,为它增添一丝“难以言喻”的魅力。

优点与缺点

优点:

  • 无与伦比的对比度
  • 超级清晰
  • 似乎比 SDXL 具有更有趣的构图和多样性

缺点:

  • 对 CFG 极其敏感。若超过 4.0,即使使用重缩放,也容易出现伪影
  • 主体知识有限

如何使用 CosXL 检查点

截至我发布本文时,ComfyUI 和 StableSwarmUI 已原生支持 CosXL。 我尚未听说其他 Web UI 支持该模型。

为更精细地控制对比度和细节,请在模型管道中添加一个 ModelSamplingContinuousEDM 节点,并调整你的 sigma_maxsigma_min 设置。

不保证完全准确,但我理解这些参数代表每一步中可从图像中移除的最大和最小噪声量。

提高 sigma_max 会增强图像对比度,但过度提升会导致图像过曝。120 似乎是标准值,我个人偏好稍高一点的数值。

你可以将 sigma_min 降低到极低数值,但我发现低于 0.0001 或高于 0.1 的值都会导致明显伪影。

推荐设置

点击此处下载示例 ComfyUI 工作流:https://github.com/roblaughter/comfyui-workflows/blob/main/cosxl_sample_workflow.json

该模型显著受益于二次采样(高分辨率修复)

第一次采样

  • 40 步
  • CFG 3.0–4.0
  • DPM++ 3M SDE Karras
  • sigma_max 200
  • sigma_min:0.002

第二次采样

  • 1.5 倍潜在上采样
  • 去噪强度 0.3–0.4
  • 20–40 步
  • CFG 3.0–4.0
  • DPM++ 3M SDE Karras
  • sigma_max 50
  • sigma_min:0.001

我发现,在第二次采样中降低 sigma 值能大幅提升精细细节,生成极其锐利的图像。

额外加分项,可添加以下内容:

  • FreeU

    • B1: 1.05
    • B2: 1.08
    • S1: 0.95
    • S2: 0.88
  • 自注意力引导(Self-Attention Guidance)

    • scale: 0.5–0.8
    • blur_sigma: 2.0–4.0
  • CFG 重缩放:约 0.3

此模型生成的图像

未找到图像。