FLUX KONTEXT + PULID (EXPERIMENTAL)
详情
下载文件
模型描述
必读说明!:
这是一个实验性工作流,旨在通过 pulid + redux + kontext 实现面部和细节的高精度生成。
Flux kontext 用于保持一致性,因此在此工作流中,我们不能更改面部的方向——结果高度依赖于输入图像。我的意思是:环境必须与面部位置相匹配。如果面部正对相机,你必须使用与此场景相符的提示词。例如,如果输入图像中的人正对相机,你不能生成侧脸或背面视角的人物图像。这是使用此工作流的首要重要规则。
此工作流不适用于全身照,它专为中景肖像或近景肖像设计。
------------------------------------------------------------------------------------------------------------------
--- 适用于低显存(6GB 及以下)---
当你在第一个采样器和第二个采样器同时运行时,可能会遇到“内存不足”错误。如果出现此问题,请重新运行工作流,直到不再出现 OOM。此工作流设计为可在 6GB 显存下运行。
--- 设备错误 -----
由于这是实验性流程,你可能会在使用 pulid 时遇到设备错误。我的 ComfyUI 版本为:v0.3.43,对我而言可以正常运行。
-----------------------------------------------------------------------------------------------------------------
“下采样因子”这一参数至关重要,它决定了参考图像的加载一致性。若将其设为接近 1,则结果更接近原始图像;若设为接近 5,则更倾向于遵循提示词。我推荐的值为 3 至 4,甚至 5。
-----------------------------------------------------------------------------------------------------------------
其他建议阅读的备注:
在某些网站结果中,我实现了 80% 至 93% 的面部一致性。
请不要上传过度放大面部的图像,应上传中景肖像图像——既不要太靠近相机,也不要太远。例如,我上传到 OPENART 的参考图就是这种类型。
“高分辨率组”(即第二个采样器)用于增强面部细节并提高一致性。我建议你保留并使用它。但如果你拍摄的是近景肖像,第一个采样器可能就已足够。
不要尝试生成全身照,此工作流专为肖像类图像设计。
Flux kontext 并非用于生成全新图像,而是用于编辑现有图像。根据我的经验,生成全新图像属于完全不同的任务。
因此,我认为此 kontext 输入的是“类 GPT”风格的图像,而非 FLUX 的真实风格。这导致一个问题:输出图像变得不真实且像塑料感。为解决它,我们需要一个优秀的 LoRA,但目前尚无(暂时)。
因此,我在本工作流中使用了 Flux Dev LoRA。它是否有效?是的,但当你增加强度时,图像会变得更模糊。我建议将强度设为最大值 1。另外,如果你不使用 LoRA,面部输出会减少模糊,但塑料感又会重现。
针对此任务,我仅使用一个 LoRA,它能更好地消除塑料感。我提供如下链接:
LoRA(提示词中请务必包含关键词):
https://huggingface.co/prithivMLmods/Canopus-LoRA-Flux-UltraRealism-2.0/tree/main
LoRA 关键词:Ultra realistic
----------------------------------------------------------------------------------------------
我期待听到你们在本工作流中的实验反馈。
如果你喜欢这个工作流,欢迎订阅我的 YouTube 频道:https://www.youtube.com/@AITold/videos
----------------------------------------------------------------------------------------------------------
适用于本工作流的优质提示词示例结构:
1- 一张超真实的全身照,展现一位容貌惊艳的女性,拥有迷人的榛绿色双眼和自然分布的雀斑,采用业余摄影的随意、孤独风格拍摄。她在深夜一间破旧的 24 小时餐厅里,独自坐在褪色的红色乙烯基卡座中。相机位于餐桌对面,略微歪斜,仿佛由同伴随手拍下。她身穿宽松的灰色连帽衫和舒适的牛仔裤,一条纤细的米色钩针网纱披肩随意搭在卡座靠背上,与环境格格不入。她双手捧着一杯厚重的陶瓷黑咖啡,神情沉静忧郁,凝视着窗外被雨水划过的街灯。桌上散落着揉皱的餐巾纸和半块吃剩的派。灯光是糟糕的混合:暖黄色的桌边点唱机光线与冷蓝色的餐厅主灯管交织,形成多重冲突的阴影。照片因低光而略带颗粒感,整体氛围是深夜静谧的沉思。
2- 一张超真实的中景照片,呈现为模糊像素化的深夜视频通话截图。这位拥有迷人榛绿色双眼与自然雀斑的美丽女性,坐在一间昏暗房间的书桌前,直视着网络摄像头,也就是直视着观众,神情疲惫但专注而投入。唯一的光源来自她电脑屏幕发出的冷白色光,强烈地照亮她的面部,投下深邃的阴影。她穿着宽松舒适的 T 恤,一条纤细的米色钩针网纱披肩搭在椅背,隐约可见于昏暗背景中。背景是她房间的真实凌乱:书架一角、墙上的海报、杂乱的物品。图像质量刻意降低,带有明显的压缩伪影和数字噪点,完美还原了“业余网络摄像头”的美学风格。
3- 一张超真实的人像,展现一位容貌惊艳的女性,拥有迷人榛绿色双眼与自然雀斑,以业余摄影的随意、笨拙风格拍摄于深夜明亮而冰冷的 24 小时便利店内。照片从低角度拍摄,仿佛由一位意外捕捉到她的朋友所拍。主要光源是刺眼的绿色调顶灯,导致她的眼下和下巴形成深而难看的阴影,使皮肤显得苍白。她站在货架间,一手拿着薯片袋,另一手握着汽水,抬头看向镜头,表情略带不耐烦,仿佛在说:“你真的现在要拍照吗?”她身着简单的 T 恤,披着那条纤细的米色钩针网纱披肩,与周围五颜六色的零食包装形成强烈违和。她标志性的红橙色珠串项圈和金质吊坠,与这平庸的环境格格不入。构图偏离中心,色彩因灯光糟糕而褪色。氛围是突兀而真实的日常感。
4- 一张超真实的中景照片,以业余摄影的随意、侵入风格拍摄。这位拥有迷人榛绿色双眼与自然雀斑的美丽女性,坐在公园长椅上,正被中断阅读。她从仍放在膝上的书中抬头,直视着持相机者,眼神中带着轻微质疑的不悦。正午强烈的阳光穿过头顶的树叶,形成斑驳闪烁的光斑与深暗阴影,散落在她的脸庞和衣物上。她身穿简单的连衣裙,那条纤细的米色钩针网纱披肩静静搭在长椅旁。相机对焦略显柔和,构图失衡,一侧留有过多空隙。这张照片真实捕捉了在公共场所被突然打断的瞬间。
5- 一张超真实的中景人像,以拥挤户外市集的混乱、快照风格拍摄。这位容貌惊艳的女性正直视镜头,表情是惊喜与淡淡微笑的自然混合。她穿着简单的夏季连衣裙。正午的强光从正上方直射,造成眼下的“浣熊”阴影。背景是嘈杂、失焦的虚化人影、彩色摊位和阳光在杂物上反射的光斑。构图不完美,画面边缘挤入了他人的肩膀。整张照片感觉像是从喧闹繁忙的一天中偷拍到的转瞬即逝的真实瞬间。







