CitrineDreamMix
详情
下载文件
关于此版本
模型描述
概述
CitrineDreamMix 是一个功能非常强大的模型,能够以多种风格生成各类主题。它特别擅长创作出风格介于动画与写实之间的精美细节图像。同时,该模型也高度专注于NSFW图像和色情内容,并支持Booru标签。
本模型由我最喜欢的两个模型融合而成:AbyssOrangeMix3 (AOM3) 和 NeverEnding Dream (NED)。我本人不主张对它们的任何工作拥有版权或所有权。
AbyssOrangeMix3 在制作复杂精细的动漫风格图像方面表现出色,但也容易过度添加琐碎细节,并略微偏离写实风格。不过,它在处理虚构角色和NSFW内容方面表现非常出色,甚至能够胜任更为小众的主题。
NeverEnding Dream 则擅长生成干净且写实的图像,但有时候会过度简化和限制细节,导致图像看起来有些平庸和基础。此外,在面对某些特定虚构角色或非写实风格的NSFW场景时,它也略显吃力。
CitrineDreamMix 的目标是寻找到 AOM3 与 NED 之间的理想平衡点,从而兼顾两者的优势。它比 AOM3 更具写实风格,也比 NED 更具动漫风格。这使得它既能保留动漫风格的典型特征(如大眼睛),又能在细节呈现上更接近写实风格,拥有精准且流畅的表现。
以下是几张对比图,展示了 CitrineDreamMix 与 AOM3 和 NED 在风格上的差异。我还附上了部分更大尺寸的对比示例图像。为了清晰展示各模型的常规风格,我尽量使用了简明提示词,因为所有模型都可以通过提示词关键词实现更偏向写实或更偏向动漫的风格调整。三者都能生成精美图像,最终选择取决于主题和您的个人偏好。
模型对比:
提示词
对于提示词,我的主要建议是使用Booru标签,因为AOM3和NED都针对此类标签进行了训练。如果您使用的是A1111,强烈建议安装 Booru标签自动补全插件,这能极大简化标签格式的掌握。
若想获得更写实的风格,可在提示词中加入“realistic”;若想强化动漫风格,则可在负面提示词中加入“realistic”。您可能需要提高权重才能看到明显差异。
对于负面提示词,我使用了一些常见的负面嵌入(negative embeddings),例如 bad_prompt_version2、EasyNegative、bad-artist 和 bad-hands-5。但尚未进行深入测试以评估其效果,因此不必认为这些是必需的。
参数设置
免责声明:
我并非Stable Diffusion或AI图像方面的专家,因此请对我所有的建议持审慎态度。这些仅为我经过少量测试后觉得表现较佳的部分设置。强烈建议您自行尝试调整参数,找到最适合自己的组合。
采样方法:
我发现 DPM++ SDE Karras 效果最佳,紧随其后的是 DPM++ 2M Karras、Euler a 和 Heun。不过,只要参数设置得当,几乎所有方法都能达到不错的效果。
采样步数:
我发现 约20步 对我而言效果很好,但10到30步之间的结果也大致相似。具体效果可能因所选采样方法而异。
CFG Scale:
我通常使用 7 的CFG Scale,5到9之间的数值也会产生几乎相同的效果。当设置在10及以上时,有时会出现奇怪的伪影或比例失调,因此建议不要设得过高。
CLIP跳过:
我发现使用 CLIP skip 2 比 CLIP skip 1 的效果略好,但两者都表现良好。CLIP skip 1 似乎更偏向写实风格,但我测试不多,因此这可能只是巧合。
VAE:
我最喜欢 Waifu Diffusion 的 kl-f8-anime2 VAE,因此在烘焙版VAE中使用了它。标准的 vae-ft-mse-840000-ema-pruned VAE 也非常好。而 orangemix VAE 对我而言会使色彩显得暗淡,因此若您希望获得更柔和、更写实的色调,可选择它。
超分辨率:
我在生成图像时使用了Hires. fix功能,将所有图像放大了2倍。
我偏爱 4x-UltraSharp 超分辨率放大器(此处还有其他放大器可供选择),但也有很多其他优秀选择,比如 R-ESRGAN-4x+,甚至Latent系列。这完全取决于个人偏好。
我将去噪强度设置为 约0.5至0.6,但具体可根据所用放大器和放大倍数适当增减。如果您在img2img中使用SD放大脚本,建议将去噪强度设得更低,约为0.2至0.3。
更新日志
2023年6月16日
- 添加了v2版本模型,以使用AOM3和NED的最新版本。详见版本说明,了解改进与差异。
2023年3月11日:
- 添加了v1.1版本模型,修复了合并尺寸问题。








