Bondiment

详情

下载文件

模型描述

你好,我已经很久没有玩过Stable Diffusion了。2019年时我曾深度投入其中,现在我打算继续享受提示词创作与图像生成的乐趣。自从约两周前回归以来,我浏览了CivitAI上许多同行所创作的精彩作品,并决定尝试在ComfyUI中进行模型合并——我过去仅在SD1.5盛行时期合并过一些小型Checkpoint或LoRA模型。

本次合并是将上述的(MiaoMiaoHarem)[/model/934764/miaomiao-harem] 与(One Obsession)[/model/1318945?modelVersionId=1897112] 进行简单合并。

这是我做过的最简单的合并之一,具体比例为:

  • MiaoMiaoHarem 模型基底的 75%
  • One Obsession 模型基底的 25%
  • One Obsession 的 CLIP 基底 100%

通过 ComfyUI 处理完成。

我进行此次合并的原因是:我发现这两个模型在提示词创作时都能提供极大的自由度,前提是用户足够具体。我注意到,由于 One Obsession 具备高度精确的提示能力及其长token化流程,该合并模型能支持比近期我尝试的其他合并更长的CLIP字符串,同时又能保留 MiaoMiaoHarem 数据集中的大量特征,从而避免了使用 One Obsession 单独生成图像时因撰写长提示词而陷入的“僵局”。

这两个模型各自都非常出色,事实上在很多方面它们单独使用效果更好。但我仍鼓励你试一试这个合并模型,并告诉我你的感受!

我不会寻求任何支持,但我希望你能向那些构建了如此庞大模型、并让社区得以自由使用的创作者们表达支持。你可以在下方找到这些原始模型:

由于该合并模型融合了两个模型的重叠范围与特性,它在多种采样器和调度器中表现尚可。以下是我个人测试后发现效果最佳的配置,我会持续更新:

CFG:通常保持在 2.2–6.5 之间可生成可识别图像,但我发现最佳效果在 3.0 至 5.0 之间。

采样器和步数的选择会因提示词的长度而变得非常不稳定。我建议:在提示词越具体的情况下,无论你创作什么内容,都应相应提高步数和CFG值。

为获得最佳效果,我按以下顺序使用:

  • DPM++_2M Karras,35步
  • Euler a Exponential,40步
  • Heun++2 Karras,50步

(MiaoMiaoHarem)[/model/934764/miaomiao-harem]

(One Obsession)[/model/1318945?modelVersionId=1897112]

话虽如此,这期间涌现了大量新事物,我一度感到不知所措,因此决定尝试合并两个我此前从未听闻的杰出模型——毕竟在我离开 Automatic1111 时,它们还不存在。为了确保尽到应尽的义务,我在离开期间面对大量新出现的许可协议时,特意查阅了模型托管方的 Hugging Face 页面:

据我理解,根据上述链接,本合并模型属于“Fair AI Public License 1.0-SD”所允许的简单合并范畴。此外,我还联系了(MiaoMiao Harem)[/model/934764/miaomiao-harem] 的发布者 MIAOKA [https://civitai.com/user/MIAOKA],他最近发布了面向 Automatic1111 用户的《MiaokaImageEffects》工具指南 [https://civitai.com/articles/16163/miaokaimageeffects-a1111-webui],并向他征询了明确许可,以保留本次合并模型。

感谢您的时间。

此模型生成的图像

未找到图像。