RobMix
详情
下载文件
关于此版本
模型描述
一个注重品质与创意表现的写实模型。
ze·nith
名词。某事物最强大或最成功的时刻。
RobMix Zenith 是我系列中手工打造的超写实模型融合的下一代版本,采用了过度夸张的版本名称。
这个融合就像一杯经典马提尼——简洁,仅由两三种成分组成,但经过精准调配与细心处理。它将 RobMix Evolution 与 Corcel 出色的 Mobius 基础模型相结合,并通过逐块微调,提取出 RobMix 风格的最佳特质与 Mobius 的高品质和创造力。
注意:Mobius 需要设置 clip skip 为 -3。本融合模型无需此设置,但你可以尝试在 -1 到 -3 之间调整 clip skip 值,以获得一些有趣的成果。
和我其他的融合模型一样,它专注于摄影风格,强调写实与创意的平衡,但如果你适当提示,也能生成一些具有插画或艺术风格的精彩作品。
该模型开箱即用效果优异,但在配合某些工作流优化后表现更佳。我在本帖末尾提供了一些建议,你可以在我的工作流中尝试:https://github.com/roblaughter/comfyui-workflows。
推荐设置
在示例图像中,二次生成使用 1.5 倍潜空间放大,去噪强度 0.3–0.4,步数 40。所有图像均在 ComfyUI 中生成。
- 采样器:DPM++ 3M SDE
- 调度器:AlignYourSteps
- CFG:3–4(或使用 Automatic CFG)
- 步数:30–40
- Clip Skip:-2 或 -3
- 宽高比:1:1、2:3、3:4、16:9、21:9,垂直或水平
高级设置
FreeU v2
- b1: 1.05
- b2: 1.08
- s1: 0.95
- s2: 0.8
扰动注意力引导(Perturbed Attention Guidance)
- Scale: 0.5–1
- 自适应 Scale: 0.1
如何提示该模型
该模型在使用自然语言风格提示时效果最佳。我通过将 CLIP-G 与 CLIP-L 分开使用,取得最理想的效果:在 CLIP-G 中使用自然语言描述,在 CLIP-L 中使用类似 SD 1.5 的关键词提示。
我创建了一个 自定义 GPT 来协助这一过程。默认情况下,它会生成 CLIP-G 风格的提示,但你也可以要求它生成 CLIP-L 或 T5 风格的提示。该 GPT 遵循我的 提示金字塔 风格,虽然未必是最佳方式,但这是我一贯的做法。
示例 CLIP-G*
一张高分辨率、氛围感十足的照片,捕捉了群山景观中宁静的日落景象。构图中,一棵孤树伫立于山坡上,轮廓被落日温暖的金色光芒勾勒。天空呈现柔和的橙黄渐变,与地平线交融。阳光穿透画面,投下长长的阴影,为起伏的山丘增添了层次感。整体氛围宁静而沉思,光影和谐平衡,曝光精准,突显了风景的自然之美与平和之感。
* 若你的提示超过 75 个 token,请确保正确处理拼接。
示例 CLIP-L
高分辨率照片,年轻女性,探身出复古红色汽车车窗,双臂交叉搭在车门上,头部微倾,神情平静沉思,目光好奇,富有互动感,上半身构图,流畅的复古车辆线条,怀旧氛围,背景柔和虚化,宁静反思的情绪,低调温暖色调,永恒质感。



















