GLOW-UP aka lazy-WAN-KR (Florence Caption -> WAN2.2 T2I -> WAN2.2 I2V)

详情

模型描述

WAN-KR 工作流的前端,通过 Florence 为图像添加字幕,并使用 WAN2.2 作为 I2V 重新生成图像,然后将其输入 WAN 2.2 进行 I2V。

V0.6 仅限:(这基本上是带有前端的多-WAN-KR。有关多-WAN-KR 的用法,请参见:多-WAN-KR (WAN 2.2 I2V clip 合并工作流) - v1.0rc3 | Wan Video 工作流 | Civitai)自 0.8 版起,它已成为单一 clip 工作流。

你还需要 WAN 2.2 T2V 的低噪声检查点,尽管它也应能与 WAN2.1 T2V 一起使用。

使用方法:拖入你旧的尘封的 SD1.5/SDXL 图像,为 WAN T2V 选择目标分辨率——尽可能高以匹配你的设备性能,然后生成。如果你想在 I2V 之前先查看结果,可用黑色组旁路器阻止视频生成。

如果 T2I 效果良好,取消阻塞 GFXCARD_GOES_BRRR,让它自行处理。
你可以向 Florence 字幕添加自己的提示指令,例如描述摄像机运动或正在发生的动作。

待办事项:增加通过 LLM 修改/增强 Florence 字幕的可能性。

此模型生成的图像

未找到图像。