DMD2 | 1 CFG SCALE | Fewer Steps

详情

模型描述

**你好,**你可能在想:为什么有这么多版本?

嗯……如果我处在你的位置,也会问同样的问题。原因很简单:这种设计是为了提供更多的控制权,因为与普通LoRA不同,DMD2在最大强度下表现最佳

例如:

  • HD 1 CFG Scale 的强度被“稀释”了,因此需要借助触发词或手动提高其LoRA强度。这使得它在Illustrious中与PDXL LoRAs结合使用时非常有用,因为你只需提高强度,而不会损失细节。

  • DPM A1DPM A15 已经自带增强的强度和细节,因此无需触发词。A1为标准强度,而A15额外增加了+15%。

  • V4 是一个通过两步生成图像的实验版本。它与HD 1 CFG的设计方式相反:不是通过降低强度来提升稳定性,而是将强度提升至1.35倍(比DPM A15多20%)。

  • V5 增强了检查点的细节,突出风格,并让提示词更有效,而无需更改你的模型。

简而言之: 这取决于你的喜好和目标。例如,V4会产生更多“噪点”(细节),若不配合真实感检查点使用,可能会牺牲部分真实感。


那这到底有什么用?

这个LoRA基于DMD2 的架构与风格,后者是一种广为人知的方法,通过减少生成步骤数量,同时不牺牲视觉质量,来优化扩散模型。


那么……DMD2是什么?

DMD2(Denoising Diffusion Probabilistic Model 2)是概率扩散模型的一种变体,通过迭代去噪过程,从噪声中生成高质量图像。
根据相关文献(如Ho等人,2020,《Denoising Diffusion Probabilistic Models》),DMD2通过减少达到与传统模型(如DDPM)相当质量所需的步骤数,优化了去噪过程。

DMD2采用了改进的反向扩散过程参数化方法,调整方差权重和去噪项以加速收敛。
在LoRA的语境中,DMD2作为训练低秩适应模块的基础,用于微调预训练模型(如Stable Diffusion)以完成特定任务,同时最小化计算成本并保留视觉质量。

总结:

此处描述的LoRAs(HD_DMD2_1_CFG-SCALEDPM_4STEPS_A1DPM_4STEPS_A15V4)是利用DMD2结构、在CFG尺度为1的情况下运行的适配版本。

这尤其有趣,因为通常需要更高的CFG尺度才能维持相同质量,但这些LoRAs可以在将生成步数减少到4、6、8或10(10是Civitai允许的最小值)的同时,仍取得令人印象深刻的效果——将生成时间从几分钟缩短到仅几秒。


核心功能

  • 专为快速生成优化:设计用于在极低的推理步数(4、6或8)下生成高质量图像,实现快速高效的生成。

  • 低有效CFG尺度:在CFG尺度约为1时表现最佳,提供创意与保真度的理想平衡,避免过拟合。

  • 三种版本满足不同需求:包含针对8步、6步和4步的定制版本,可根据速度与细节需求灵活选择。

  • 强大的视觉质量:即使在减少步数的情况下,依然保持色彩、纹理和构图的强细节——非常适合需要兼顾速度与质量的应用。

  • 广泛适用性:适合希望在不牺牲图像清晰度的前提下优化生成时间的用户。


使用说明与建议

  • 如果你使用的LoRA需要更多步骤才能获得良好效果,可以提高LoRA强度,或添加如**"hdr"等关键词作为正向提示词以改善光影与细节,并使用"flat color"**等负向提示词控制饱和度与阴影。

  • 或者,你也可以降低LoRA强度,这样就能使用更高的CFG尺度而不至于导致图像过度饱和。但请注意,由于此LoRA主要针对CFG尺度为1设计,理想强度可能因具体用途而异。

  • 请尝试调整强度与CFG尺度,找到最适合你工作流程与目标风格的平衡点。

此模型生成的图像

未找到图像。