(SFW/NSFW) Simple Z Image Turbo img2img (Bringing Realism to Any Picture)
详情
下载文件
关于此版本
模型描述
简而言之:用你最喜欢的模型生成一个弯腰的少女,然后用 Z-image 让它变得真实!
附注:如果你发现工作流有任何问题,请告诉我,我会修复。
Z-Image Turbo 是一款绝对惊人的文生图模型。其输出的逼真度和成熟度,不仅可以原生地根据提示生成图像,还能用于优化其他模型生成的图像。诀窍在于以低去噪强度作为优化步骤使用。这样能保留原有结构,同时添加自然的纹理、深度和光影效果。
例如,这是我用 SDXL 模型生成的一张图:

这是同一张图经过 Z-noise img2img 处理后的效果。注意她的脸部更干净了,背景也明显减少“噪点”,更加一致。同时,她手中的手机外观也更清晰、更整洁。

Z-Image Turbo 拥有强大的细节合成能力。在低噪点水平下,它更像是一个写实润色工具,而非彻底重绘。它能保留原有姿势、面部特征和构图,同时增加毛孔、发丝、布料纹理、微阴影以及更真实的光影效果。
如何在 NSFW 内容中使用它
这正是我最初想尝试用 Z Image 进行 img2img 的原因。
唯一的问题是:Z Image 完全不认识阴茎或阴道。它会把它们处理得一团糟。因此,我这个小脑瓜能想到的最简单解决方案就是:遮盖那些敏感部位,只对图像其余部分进行去噪。根据我的实验,这效果相当不错。
比如,这是我随手画的一张图,没有做面部优化,仅使用基础图(1216x832),由 Illustrij(一个 Illustrious 模型)生成。我只用了一个 LoRA(韩国女孩风格),几乎没有修改图像,目的是保持一种半写实、略带塑料感的风格,来展示 Z Image 的惊人效果。

需要遮盖生殖器区域,并反转该遮罩,以便让 Z Image 对图像其余部分进行去噪。

因此,当你在 ComfyUI 的遮罩编辑器中反转遮罩后,你的 Load Image 节点应如下所示:

然后你就可以运行 img2img 了。
这是我用 0.55 去噪强度得到的结果。我为她的面部添加了一些细节,其他地方也做了微调,但核心思路是一样的:

另一个例子:
处理前(用 Nova Asian——我最喜欢的模型之一生成):

处理后(使用 Z Image img2img):

你可以看到男人阴茎上有一点凸起。这可能是我的提示词导致的问题,我不确定,有时会出现一些小瑕疵。如果你完全无法消除这类小问题,可以手动在 Photoshop 或类似软件中修复。
哦,我刚注意到,她脚边能看到金色戒指。这是因为我在提示词中保留了“金色耳环”,尽管 Z Image 应该知道她戴在耳朵上。这提醒你:在调整去噪强度和提示词时,要留意这类细节。
重要提示:糟糕的遮罩会导致生殖器及其周围区域出现明显的不连贯。我不是遮罩高手,但请花时间制作一个极其干净的遮罩,你会感谢自己的耐心。
理想的输入图像
- 半写实的人像
- 具备良好阴影的动漫图像
- 已有一定深度的风格化艺术
- 其他模型生成的轻度写实渲染图
如果基础图像过于平面或高度风格化,写实效果会较弱。
去噪强度
0.1 到 0.65 之间均可。
当然,我们希望尽量接近 1.00 去噪,但那样显然会破坏结构和原始图像风格。这个参数需要反复调试。
采样器
我本人使用 euler/simple。如果你知道其他更好/更优的采样器/调度器组合,尽管使用。Res_multistep 看起来也很有趣。
步数
9-20 步
完全取决于你。我通常用 12 步,效果极佳。超出这个范围似乎没有明显提升,但耗时却大幅增加。
CFG(提示词相关性)
1-3
因为我们进行的是低去噪强度的 img2img 优化,所以可以适当提高 CFG 值。图像的某些部分不会像常规 1.00 去噪的 txt2img 那样“过度渲染”。
工作流(包含常规 img2img 和带遮罩的 img2img,作为附件)
这是我为 Z-image img2img 创建的当前工作流。它使用了 Z Image 的 AIO 检查点,可在此处获取(当然你也可以使用独立的 Z Image 模型 + separate clip/vae,只需重新连接节点即可):
https://huggingface.co/SeeSee21/Z-Image-Turbo-AIO/tree/main
开始前请完整浏览整个工作流。它包含主图像生成部分、FaceDetailer、HandDetailer、可选的 SkinDetailer、放大器和保存图像节点。抱歉用了这么多自定义节点,你当然可以用其他工作流,我只是自己慢慢摸索出了这套方案,效果非常好。
- 将你的图像粘贴到 Load Image 节点
- 设置提示词、参数等
- 在 KSampler 中调整去噪强度(建议从低值开始,如 0.40)
- 运行
- 调整提示词和 CFG,直到你满意
- 这个过程可能有点不稳定,请耐心一点,逐步理解其运作原理
小贴士
如前所述,不要害怕调整 CFG,尤其是用来突出 Z Image 默认可能弱化的关键特征。我常使用 CFG 2 或 3,配合加权标签(如:she has very pale skin:1.2),来强化皮肤的极白色调。这只是个例子。
- 这种 CFG 调整方法对 FaceDetailer 节点同样有效。
你可以将原始提示词迁移到 img2img 工作流中,但通常需要修改,这需要你反复试验。我所有的图像都基于 Danbooru 标签,因此我通常先看一次测试渲染,观察 Z Image 产生的瑕疵,再据此删减或重写提示词。你也可以将图像或提示词输入 LLM,让它生成更自然、更适合 Z Image 理解的提示词。
据我理解,最好从一张已完成并已放大的图像开始。如果你从低分辨率图像开始,先 img2img,再强行放大,会注意到一些小问题,比如色带(我确实遇到过)。img2img 本质上是“混合”两种图像风格,不同模型对阴影、光照、配色等的理解和实现方式差异巨大。因此,建议最终检查图像是否存在瑕疵,这些本可通过更完善的生成流程避免。
处理前后预期
低去噪强度的 Turbo 不会取代构图或解剖结构。它的作用是为你的现有图像添加自然的“润色”,就像通过一个真正理解深度与纹理的写实滤镜。
你保留相同的角色、相同的构图,
只是得到一个更干净、更锐利、更可信的版本。
问题、评论、疑虑?
如果你对这个工作流或相关内容有任何疑问或想法,欢迎留言。
顺便说一句,我并不自认是这方面的专家,我只是发现这个方法效果很好。它并非最终或完美的方案。
