Chef's Matrix Chair

详情

模型描述

问候各位厨师!

点击下方的“显示更多”以阅读使用本模型的完整指南和技巧。

我是 Promptnanimous,而“厨师矩阵椅”是我首次公开发布的混合模型。

我已为期一个月细致地测试了这个混合模型,以发掘它的秘密,现在是时候与你们分享了!希望你们能玩得开心,并请与我们分享你们的发现!

如果你喜欢我的指南和模型,请考虑关注我、与朋友分享这个模型,或为我买一杯 ko-fi。未来我将发布更多模型、指南和示例图像!

“厨师矩阵椅”示例图像

我的示例图像几乎全部使用 txt2img 和 hires.fix 生成,未使用任何 lora/lycoris/loha 或 control net。这是为了让你最准确地了解模型的能力。

以下是我使用该模型生成超过2000张图像后,基于其在多种媒介、主题和风格下的观察总结出的模型特性。你可能会发现它在某些方面表现得比我列出的更好或更差。无论如何,都请告诉我,让我可以学习并调整!

优势

  • 人物

  • 皮肤细节(需借助特定提示——请参考示例图像,并选择负面 TI:CyberRealistic NegativeSkinPerfection Negative v1.5 组合使用)

  • 各个年代(90年代、70年代等)

  • 艺术家风格

  • 风格融合

  • 半写实风格

  • 媒介(照片、Cinestill 800、海报、手绘插图、卡通、CGI 等)

  • 视角(俯视、全身、肖像等)

  • 美丽女性(你们中的一些人不会感到无聊)

表现尚可

  • 写实风格

  • Danbooru 标记

  • 贴纸(需恰当提示——参见示例图像)

  • 面部特征多样性

  • 姿势(如需更好效果,可始终使用 ControlNet)

  • 某些电影和电视节目的风格(参见示例图像中的已知例子)

  • 动漫风格

  • 室内与家具(有时好,有时不行)

弱点

  • 手部(你可以先使用你喜欢的提示,再叠加 good hands beta lycoris

  • 持物能力

  • 动物(表现不稳定,“dog” 不行,但“great dane” 可以)

  • 真正的摄影级写实——有许多优秀模型在写实方面表现更佳。这个模型能做些酷炫的事,但我不会宣称它是最好的!

  • 与部分动漫/手绘 lora 的兼容性(并非完全不兼容,但可能出问题)

  • 有时人物面部会出现奇怪线条或印记,取决于提示——我喜欢用 adetailer 来清除这些烦人的东西

  • NSFW 行为(你可能需要使用专业 lora 或嵌入,但结果因人而异)

请务必查看推荐资源,并参考示例图像,了解我是如何使用的。

如果你无法获得与我类似的效果,请尝试以下方法

  1. 确保你的设置与图像元数据中的完全一致,包括 VAE、Clip Skip、放大器、去噪强度和标记组合设置。

  2. 确保你没有意外启用任何额外扩展/插件,如 ControlNet 等。

  3. 如果你希望在改变场景或角色等细节时保留“风格”,请不要过度更改提示词顺序。通过最小编辑,你可以在保持风格的同时,使用不同角色和场景生成相似图像。

  4. 如果主要差异在面部,你可能选中了我使用 adetailer 的图像,请确保启用它(如未安装请先安装),并复制图像元数据中的 adetailer 额外设置。

  5. 我使用了 xformers,这意味着即使使用相同种子,我的生成结果在某些细微处也是非确定性的。如果你的图像几乎一致,仅在极细微处有差异,这便是原因。无法解决,这是 xformers 的运作方式。

  6. 如果以上均无效,请给我发消息,我会尽力帮助你。

常用生成设置

为在速度与质量间取得良好平衡,我使用以下设置快速迭代新提示:

  • VAE:vae-ft-mse-840000-ema-pruned.safetensors

  • Clip Skip:1

  • 采样器:UniPC

  • 步数:40

  • 高度:512

  • 宽度:768

  • CFG:6 至 8 之间

  • hires.fix:是(如追求更快生成,可选“否”,但会牺牲细节清晰度)

  • hires 步数:20

  • 去噪强度:0.45 - 0.55(取决于我的耐心程度——数值更低可稍快)

  • 放大倍数:1.5

  • 放大器:Latent(双三次抗锯齿)OR 4x_fatal_anime_500000_G OR 4x_foolhardy_Remacri

  • 标记合并比率:0.5

为追求极致质量(但速度较慢),我在上述设置下找到一批较优结果后使用:

  • VAE:vae-ft-mse-840000-ema-pruned.safetensors

  • Clip Skip:1

  • 采样器:DPM++ SDE Karras

  • 步数:25

  • 高度:512

  • 宽度:768

  • CFG:6 至 8 之间(部分提示可更高,以获得更震撼效果且无异常瑕疵)

  • hires.fix:是

  • hires 步数:20

  • 去噪强度:0.45 - 0.55(0.45 偏“柔和”,0.55 偏“锐利”)

  • 放大倍数:2

  • 放大器:Latent(双三次抗锯齿)OR 4x_fatal_anime_500000_G OR 4x_foolhardy_Remacri

  • 标记合并比率:0.5

推荐尝试的实验方向

我未花太多时间实验以下项,你可能通过尝试新设置获得有趣或惊喜的结果:

  • 除 vae-ft-mse-840000-ema-pruned.safetensors 外的其他 VAE

  • 除 UniPC、DPM++ SDE Karras 和 DPM++ 2M Karras 之外的其他采样器

  • 角色与动作 LORAs

  • 更宽的 CFG 范围(效果也取决于你选择的采样器和步数)

  • Clip Skip 设为 2(或其他非 1 的值)

随机小贴士

如前所述,我在迭代与批量高质量生成时会采用不同设置。速度与质量之间需要权衡。缓慢实验是糟糕的,但如果我确信超过 50% 的批量结果符合预期,我并不介意等待。

我有时会加入 good hands beta lycoris,或在需要时添加 detail tweaker lora。由于 loras 会降低生成速度,我在迭代时尽量避免使用,除非专门测试某个 lora 的能力。

使用本模型生成优质结果通常不需要负面 TI,但我常使用某些,它们能带来极佳效果。我特别喜欢将 CyberRealistic NegativeSkinPerfection Negative v1.5 组合,用于推动人物写实效果。我还常用其他多个负面 TI 组合,包括 verybadimagenegative v1.3bad-hands-5aid28badv5deformityv6bad_picturesbad-picture-chill-75v 等,可能还有几个我漏掉了。

如果你发现某些负面 TI 包含字符 "en_",它们来自一套尚未发布的自定义负面 TI。若需求足够,我会尝试说服创作者发布,或代为发布。

在负面提示中使用 “greyscale” 并结合不同注意力,可控制颜色。

在负面提示中使用 “symmetry” 可获得更有趣的效果,我喜欢设为 1.3 的注意力。

在负面或正面提示中使用 “plump” 可控制主体的丰满度。

面部特征——如果你生成的面部都长得一模一样,很可能你无意中使用了影响面部外观的某个或多个标记。对此你几乎无能为力,只能花大量时间找出“锁定”面部特征的标记,然后通过提示编辑延迟这些标记,例如 [token:0.3]。

以上同样适用于 loras(提示编辑那部分不适用)。有时 loras 会超出其设计意图,影响其他生成内容。如果你的生成结果出现非预期的特性,且负面提示无效,问题可能出在你使用的 lora 上。某些 lora 可能无法“修复”这些不想要的特性。

尽量减少提示中的标记数量。这不是硬性要求,但有助于稳定。使用大量标记也能获得很棒的结果,只是更难平衡,且由于标记以75个为一组送入 UNet 的分块逻辑,标记越多,结果可能越不稳定且出现意外变化。

关于我

我已每日使用 Stable Diffusion v1.5 模型和 Automatic1111 约八个月,期间生成了超过五万张图像,并通过快速迭代不断学习提示技巧与设置。

我的专注领域是仅通过 txt2img 和 hires.fix 获取模型的最佳效果,不使用 img2img 和修复等其他技术。我喜欢通过找到优秀设置实现简洁高效的高质量图像生成。我也尽量避免使用 loras,因为它们会拖慢生成速度,但为获得特定风格或使用“修复型”lora(如 good hands beta 和 detail tweaker)时,我会酌情使用。

如果你喜欢我的指南和模型,请考虑关注我、与朋友分享这个模型,或为我买一杯 ko-fi

未来我将发布更多模型、指南和示例图像!

此模型生成的图像

未找到图像。