实验性 Mochi
Mochi 原生支持最新版 ComfyUI,请执行 git pull 或更新。
采样器:
我建议将不同系列的采样器串联使用,以在每一步中获得各自的最佳效果,顺序很重要。我通常以 1 步 dpm_adaptive 开始以提高成功率,接着 1 步 sonar_dpmpp(学生-t)以增强创意性,最后用 3 步 ipndm 和 4 步 ddim 结束。
在我的示例中,采样器链为:1 步 dpm_adaptive > 1 步 sonar_dpmpp_sde(学生-t)> 1 步 lcm > 2 步 SamplerDynamicCFGpp > 4 步 heun
5gen/3d 风格视频的采样器链为:2 步 SamplerHeunCFGPP > 3 步 ipndm > 4 步 ddim
dpm_adaptive|fe_heun3|ae_dopri5(+Guide)
sonar_dpmpp_sde(student/pink|power/uniform)|dpmpp_dual_sde_momentumized| dpm_2_ancestral(+Color)
SamplerDPMCFGpp|heun_cfg_pp|distance_s4e1_cfg_pp|
SamplerCCCFGpp/SamplerDynamicCFGpp|SamplerHeunCFGPP|uni_pc
lcm
dpmpp_2m_sde/3m|*_gpu
tcd_w
ipndm/majority|heun
SamplerX0CFGpp
为加快生成速度,我通常先用 5 步生成,当发现不错的结果时,再以至少 9 步重新生成。
噪声类型:
3D 噪声(金字塔、perlin、分形、voronoi 等)或拉普拉斯噪声无效
有效:uniform、power、pink、studentt
无效:green_test、gaussian
VAE:
你可能会遇到内存溢出。在 Genmo Mochi 推出轻量级自编码器之前,请使用参数 "--cpu-vae" 避免此问题,但速度会慢 6 倍;或使用 "latent upscale by" 快速输出(但会出现模糊);或保存潜变量,稍后解码。
CFG:
为获得成功生成,我建议 CFG 值大于 1。
使用良好的采样器链,即使 CFG 为 1 也能获得不错的图像。
调度器:
在找到你最喜欢的配置前,使用原始方法对 "BetaSamplingScheduler" 的 alpha 和 beta 参数进行随机化。
硬件规格:
我使用的是 NVIDIA GeForce GTX 1660 SUPER,6GB 显存(比 30**/40** 系列慢约 10 倍)。如果我能用它运行,你也可以。如果你有较好的显卡和显存,可尝试使用正确的分辨率、时长和 VAEDecode,我尚未测试,需自行实验。如果你只有 4GB 显存,可尝试降低时长和分辨率,但我在测试中未获得理想效果。