Wan2.1-VACE GGUF Workflow for "Free Length" ref2video using For Loop (version 4)

详情

模型描述

描述:

您可以根据原始视频的“长度”和“循环次数”设置,创建任意长度的视频。

除“主配置”中的参数(包括上述参数)外,无需进行其他调整。

制作此模型感谢 @BenjisAIPlayground(https://www.youtube.com/@BenjisAIPlayground)提供的绝佳机会。

功能说明(供有意修改者参考):

  1. 首张参考图像(ref image)最好使用 Flux Kontext 或类似模型,以匹配视频的起始帧和构图。但在我看来,Wan2.1 VACE 因其良好的追踪能力,可直接使用而无问题。

  2. 块大小(由“长度”指定)会影响输入和输出帧的数量(也影响第一轮循环与后续循环之间),我已修正输出帧数,使其始终为“长度-1”。

  3. 我发现参考图像(ref image)的颜色会在每轮循环中逐渐饱和,因此在循环输入前,使用最新的参考图像进行色彩匹配。

  4. 输出视频默认为30帧/秒;若您处理的是60帧/秒的输入视频,请相应调整“nth”参数。


更新日志:


(v3.0 → v4.0)

改进(?):

  1. 当使用参考视频背景/物体(采用 CN:DWPose)时,新增了适用于 CN 的 WanVaceToVideo,以确保 CN 控制线不会出现在最终输出中。

    (不确定质量是否明显优于 v3.0,期待反馈。)


(v2.0 → v3.0)

改进:

  1. 使用视频背景时(采用 SAM 掩码),通过注入 CN(DWPose)元素提升了输出效果。

  2. 使用参考图像背景时(采用 ControlNet),可更精确地设置 CN;推荐使用深度图(Depth)。

  3. 相关地,“主配置”设置可调整,包括在提示词中指定背景的情况(参见“如何选择#”中的说明)。

  4. 增加了提示词生成支持功能(使用 Ollama)。


(v1.0 → v2.0)

改进:

  1. 现在可控制背景。

  2. 通过选择图像(ControlNet)或视频(掩码)处理,显著缩短了处理时间。

错误修复:

  1. 输出视频现在包含音频。

此模型生成的图像

未找到图像。