PinkiePie pony mix

详情

模型描述

一种基于半写实(2.5D)Pony-diffusion 的混合模型

这是另一个名为 Pinkie Pie 的开源/免费融合模型。

早期访问

我仅仅为了好玩启用了早期访问功能 :)

但你不必捐赠任何东西。7天后它将自动公开!

版本说明

  • v2.2 - 高细节,~2.5D

  • v3.3 - (基于v2.2)- ~2.8D,对比度更高,细节更少,需高分辨率修复。

  • v3.4 - (基于v2.2)- ~2.8D,减少细节,适用于普通使用。

  • v3.5 ALT - (基于v2.2)- ~2.8D。轻微修复了文本编码器问题。

  • v3.6 - (基于v3.5 ALT)- ~2.8D。轻微优化了面部与风格。

融合模型

v1.0 的融合配方

使用 Model Mixer https://github.com/wkpark/sd-webui-model-mixer 一次性混合所有模型。配方详情包含在模型检查点或部分图像中。(因此你可以轻松使用或修改此配方,通过模型混合器实现)

  • 包含 VAE。

  • 所有版本的配方均包含在检查点元数据中!

以下是使用模型混合器扩展的 sd-webui 截图:

基本配方如下:

  1. 步骤#1:基础模型 A + 模型 B × 0.3 = mix_A(排除文本编码器)DARE 融合方法(模型混合器支持简化版DARE方法)

    - 经过多次试验后,OUT01 权重从 0.3 降至 0.1

  2. 步骤#2:块级混合 - mix_A + 模型 C = 最终混合 - DARE 融合方法

    - 说明:在 MID + OUT00~OUT08 上进行块级合并。

    - SDXL 的 OUT00 ~ OUT02 块影响广泛,尤其在面部风格上。

    - 注意:DARE 方法内部使用随机枢轴,因此每次融合结果可能略有不同。

  3. 调整设置:此为优化模型细节与色调的调整设置,time_embed.*out.* 权重已调整(请参阅 https://github.com/hako-mikan/sd-webui-supermerger?tab=readme-ov-file#adjust)!

推荐

有用的 AUTOMATIC1111 WebUI 扩展

以下 sd-webui 扩展推荐使用:

更新日志

  • 2024/05/16 - 首次发布

  • 2024/05/18 - 发布 v1.3,修复了少量文本编码器问题。(完全重建)

    • yaminabepony 的 BASE 替换了特定文本编码器权重

      • BASE:layers.1.*,BASE:resblocks.5.* 存在错误,已替换。

      • 更多权重层级问题将很快修复☕👀

  • 2024/05/26 - 发布 v1.4,修复了少量文本编码器问题。(v1.0 + 额外文本编码器修复)

    • v1.4 = v1.0 + 使用 yaminabepony 的文本编码器进行额外修复

      • BASE:layers.1.* 使用 1.0 权重(DARE 融合)

      • BASE:resblocks.1.* 使用 0.2 权重(DARE 融合)

      • BASE:resblocks:5.* 使用 1.0 权重(DARE 融合)

  • 2024/06/08 - 发布 v1.5,修复少量文本编码器问题(+亮度调整)

  • 2024/06/08 - 发布 v1.6,修复少量文本编码器问题(v1.5 热修复)

  • 2024/06/08 - 发布 v2.0,修复了“OUT08”块级问题。(结合 MIST 检查点,增强细节)

  • 2024/06/13 - 发布 v2.1,使用调整参数优化细节(未使用 MIST 检查点)

  • 2024/06/15 - 发布 v2.2,修复了文本编码器问题(v2.1 + 文本编码器修复)

  • 2024/06/21 - 发布 v3.0,修复了面部风格(以 v2.2 为基础 + 与 white_v2.0 模型进行块级融合 + 更多 yaminabepony v3 块级融合)

  • 2024/06/29 - 发布 v3.1,修复面部风格(更多块级调优 + 额外融合 xxmix + mist)

  • 2024/07/12 - 发布 v3.2,修复文本编码器(text_l 替换为 MIST 的,text_g 使用 yaminabepony 的 token_embedding.weight 修复,轻微调整细节)

  • 2024/07/20 - 发布 v3.3,修复文本编码器 + 为“真实”和“照片”提示优化块级 Unet(强烈推荐高分辨率修复)

  • 2024/07/21 - 发布 v3.4,减少 v3.3 的细节/噪点,适用于无需高分辨率修复的常规使用

  • 2024/08/03 - 发布 v3.5-alt,尝试修复文本编码器以解决与“真实”、“照片”提示相关的问题

  • 2024/12/13 - 发布 v3.6,轻微修复面部风格(使用 xxmix9)

待办事项

  • 添加更真实的肤色

  • 优化细节调整参数以实现更高真实感(v2.x)

  • 减少西方风格面部特征

  • 增加亚洲风格面部(v3.x)

  • 修复细节层级(v2.x)

已知问题

  1. (v1.0~)某些提示词会生成锯齿状图像,例如:

此问题源于原始模型的文本编码器(本例中,RealDream Pony v2 在 A1111 下也产生完全相同的错误)。此问题在 v1.2 融合模型中有所缓解。

  • 该问题被怀疑是特定权重错误,通过替换特定 CLIP 权重已解决。

  • (此问题已在 RealDream Pony v3) 中解决)

  1. 某些提示词会使生成图像看起来有点卡通化和丑陋:例如“大眼睛”、“咧嘴笑”等。

许可证

此处使用的所有模型均具有“共享融合时权限不同”的许可证许可,因此我不会添加额外限制。

原始 Pony-diffusion v4 许可证声明“相同许可证限制”,因此除相同许可证限制外,我不会添加任何额外限制。(请参阅 https://huggingface.co/AstraliteHeart/pony-diffusion-v4https://huggingface.co/spaces/CompVis/stable-diffusion-license

CreativeML-Open Rail++-M

本模型允许用户:

✔ 无需署名即可使用模型

✔ 出售所生成的图像

✔ 在用于盈利的图像生成服务上运行

✔ 共享基于本模型的融合版本

✔ 出售本模型或基于本模型的融合版本

❌ 共享融合版本时享有不同权限

特别地,OpenRAIL-M 许可证允许用户拥有其生成图像的权利,并可用于商业目的(Stable Diffusion)(Baseten)。这种开放性支持广泛的应用,从创意项目到商业服务,使企业和个人能够利用模型能力实现多种用途。

因此,若你考虑将 Stable Diffusion 用于商业产品或服务,只要遵守许可证中列出的指南和限制,许可条款即支持此类使用。(来自 ChatGPT)

支持我

如果你喜欢我的作品,欢迎在 ko-fi 上请我喝杯咖啡。https://ko-fi.com/mixboy

此模型生成的图像

未找到图像。