WAN 2.2 GGUF/start end frame/t2v/i2v 8gb/10 seconds to 4 minutes workflow

详情

模型描述

WAN 2.2 – 首帧到末帧电影级工作流(含径向/稀疏Sage注意力补丁)

无回环的超稳定10秒视频

完整Windows指南(Triton • SpargeAttn • RadialAttn)

运行要求:

Windows • Python 3.10–3.11 • RTX 4060 Ti 8GB 或更高

ComfyUI 版本: 0.3.6+
WAN 版本: WAN 2.2 GGUF(VAC + CLIP)/ 可根据需要切换其他模型


此工作流的功能

本项目可生成完全稳定的10秒视频,具备:

  • 无乒乓回环

  • 无帧坍塌

  • 无变形伪影

  • 完美起始→结束插值

  • 全世界空间运动(非像素变形)

  • 高时间稳定性

  • 电影级镜头运动

  • 可选电影VFI慢动作

  • 可选x4超分+锐化

与默认WAN或标准采样器不同,此版本使用:

SparseSageAttn + RadialAttn
将WAN的注意力窗口从约80帧扩展至161帧以上

这使得WAN能够将完整的10秒视为一个连贯场景进行渲染。


功能亮点

  • 真正的首帧到末帧世界构建

  • SD3 “Shift” 参数(推荐:10秒片段设为50)

  • 支持起始帧+结束帧图像(24个完全可控场景)

  • 兼容图生视频与文生视频

  • 流畅电影级运动

  • 电影颗粒、雾效、单色稳定性

  • 可选 ClearReality x4 超分

  • 可选锐化处理

  • 兼容8GB显卡


🔧 安装(Windows)

步骤1 — 安装Windows版Triton

WAN 2.2 + RadialAttn 需要 Triton。
请在此下载适用于Windows的轮子:
https://github.com/woct0rdho/triton-windows/releases

在你的虚拟环境(venv)中安装。

步骤2 — 安装SparseSageAttn

从以下地址下载Windows版轮子:
https://github.com/woct0rdho/SpargeAttn/releases

在你的虚拟环境(venv)中安装。

步骤3 — 安装RadialAttn节点

从以下地址下载:
https://github.com/woct0rdho/ComfyUI-RadialAttn

将其放入你的ComfyUI custom_nodes 文件夹中。

步骤4 — 重启ComfyUI

若Sparse / Radial Attn加载正确,启动日志将显示:
“Using sparse_sage_attn as block_sparse_sage2_attn_cuda”

此时补丁已激活。


📸 工作流原理

1. Shift节点(SD3风格条件控制)

提高SHIFT值告诉WAN:
“在时间上保持场景的物理一致性。”

推荐每秒视频设置:
SHIFT = 秒数 × 5
→ 对于10秒视频:SHIFT = 50

这将稳定整个世界运动。


2. 首帧到末帧采样器

输入:

  • 起始帧(图像A)

  • 结束帧(图像B)

并生成跨越161帧的平滑世界空间插值。

注意力补丁扩展了WAN的时间记忆,使其不再出现乒乓回环。


3. FILM VFI(可选)

启用后,可平滑地将帧率加倍或四倍。
请在基础渲染后使用。


4. 超分(可选)

  • 超分模型 = ClearReality x4

重要提示

对于8GB显卡:

  • 请在VFI之后进行超分
    以避免VRAM溢出

  • 测试期间禁用超分(将超分+锐化放入组开关中)


🎥 如何使用该工作流

1. 加载你的起始与结束图像

每个场景使用一对图像(A → B)。

2. 输入你的电影级提示词

示例提示结构:

“视频始于一片雾气弥漫的德国森林。摄像机沿一条泥泞小路缓慢前移。无变形。这是一个连续的世界。视频结尾,摄像机抵达废弃村庄,保持相同的电影级单色风格。”

3. 设置 SHIFT = 50

(适用于10秒视频)

4. 渲染“首帧到末帧”

WAN将直接生成完整的161帧运动。

5. 可选:启用FILM VFI

用于慢动作/更平滑的运动。示例:WAN 2.2 训练于16fps — 设置VFI x2,输出为32fps;设置VFI x4,输出为64fps。

6. 可选:启用超分与锐化

以获得最高清晰度。


如需帮助设置任何内容

将本完整描述复制粘贴至ChatGPT,并提问:

“我想完全按照上述描述(包含Triton、SparseSageAttn、RadialAttn、SD3 SHIFT=50、双K采样器,以及可选的超分/锐化部分)重建此WAN 2.2首帧到末帧工作流。
请帮我一步步在ComfyUI中重建。”

它将为你提供详细指导。


🏁 最终说明

本工作流专为以下用途设计:

  • 电影级运镜

  • 世界构建

  • 稳定长序列

  • 场景间叙事

  • 低伪影的一致运动

SHIFT、首帧到末帧与注意力补丁的结合,实现了真正的10秒无循环场景


附加提示:
你可以通过将一个场景的“末帧提取器”输出连接至下一个场景的“起始图像”输入,将多个场景串联成一部连续电影。这能确保无缝衔接,无需手动重新加载图像。

此模型生成的图像

未找到图像。