WAN 2.2 GGUF/start end frame/t2v/i2v 8gb/10 seconds to 4 minutes workflow
详情
下载文件
模型描述
WAN 2.2 – 首帧到末帧电影级工作流(含径向/稀疏Sage注意力补丁)
无回环的超稳定10秒视频
完整Windows指南(Triton • SpargeAttn • RadialAttn)
运行要求:
Windows • Python 3.10–3.11 • RTX 4060 Ti 8GB 或更高
ComfyUI 版本: 0.3.6+
WAN 版本: WAN 2.2 GGUF(VAC + CLIP)/ 可根据需要切换其他模型
⭐ 此工作流的功能
本项目可生成完全稳定的10秒视频,具备:
无乒乓回环
无帧坍塌
无变形伪影
完美起始→结束插值
全世界空间运动(非像素变形)
高时间稳定性
电影级镜头运动
可选电影VFI慢动作
可选x4超分+锐化
与默认WAN或标准采样器不同,此版本使用:
SparseSageAttn + RadialAttn
将WAN的注意力窗口从约80帧扩展至161帧以上。
这使得WAN能够将完整的10秒视为一个连贯场景进行渲染。
⭐ 功能亮点
真正的首帧到末帧世界构建
SD3 “Shift” 参数(推荐:10秒片段设为50)
支持起始帧+结束帧图像(24个完全可控场景)
兼容图生视频与文生视频
流畅电影级运动
电影颗粒、雾效、单色稳定性
可选 ClearReality x4 超分
可选锐化处理
兼容8GB显卡
🔧 安装(Windows)
步骤1 — 安装Windows版Triton
WAN 2.2 + RadialAttn 需要 Triton。
请在此下载适用于Windows的轮子:
https://github.com/woct0rdho/triton-windows/releases
在你的虚拟环境(venv)中安装。
步骤2 — 安装SparseSageAttn
从以下地址下载Windows版轮子:
https://github.com/woct0rdho/SpargeAttn/releases
在你的虚拟环境(venv)中安装。
步骤3 — 安装RadialAttn节点
从以下地址下载:
https://github.com/woct0rdho/ComfyUI-RadialAttn
将其放入你的ComfyUI custom_nodes 文件夹中。
步骤4 — 重启ComfyUI
若Sparse / Radial Attn加载正确,启动日志将显示:
“Using sparse_sage_attn as block_sparse_sage2_attn_cuda”
此时补丁已激活。
📸 工作流原理
1. Shift节点(SD3风格条件控制)
提高SHIFT值告诉WAN:
“在时间上保持场景的物理一致性。”
推荐每秒视频设置:
SHIFT = 秒数 × 5
→ 对于10秒视频:SHIFT = 50
这将稳定整个世界运动。
2. 首帧到末帧采样器
输入:
起始帧(图像A)
结束帧(图像B)
并生成跨越161帧的平滑世界空间插值。
注意力补丁扩展了WAN的时间记忆,使其不再出现乒乓回环。
3. FILM VFI(可选)
启用后,可平滑地将帧率加倍或四倍。
请在基础渲染后使用。
4. 超分(可选)
- 超分模型 = ClearReality x4
⭐ 重要提示
对于8GB显卡:
请在VFI之后进行超分
以避免VRAM溢出测试期间禁用超分(将超分+锐化放入组开关中)
🎥 如何使用该工作流
1. 加载你的起始与结束图像
每个场景使用一对图像(A → B)。
2. 输入你的电影级提示词
示例提示结构:
“视频始于一片雾气弥漫的德国森林。摄像机沿一条泥泞小路缓慢前移。无变形。这是一个连续的世界。视频结尾,摄像机抵达废弃村庄,保持相同的电影级单色风格。”
3. 设置 SHIFT = 50
(适用于10秒视频)
4. 渲染“首帧到末帧”
WAN将直接生成完整的161帧运动。
5. 可选:启用FILM VFI
用于慢动作/更平滑的运动。示例:WAN 2.2 训练于16fps — 设置VFI x2,输出为32fps;设置VFI x4,输出为64fps。
6. 可选:启用超分与锐化
以获得最高清晰度。
⭐ 如需帮助设置任何内容
将本完整描述复制粘贴至ChatGPT,并提问:
“我想完全按照上述描述(包含Triton、SparseSageAttn、RadialAttn、SD3 SHIFT=50、双K采样器,以及可选的超分/锐化部分)重建此WAN 2.2首帧到末帧工作流。
请帮我一步步在ComfyUI中重建。”
它将为你提供详细指导。
🏁 最终说明
本工作流专为以下用途设计:
电影级运镜
世界构建
稳定长序列
场景间叙事
低伪影的一致运动
SHIFT、首帧到末帧与注意力补丁的结合,实现了真正的10秒无循环场景。
附加提示:
你可以通过将一个场景的“末帧提取器”输出连接至下一个场景的“起始图像”输入,将多个场景串联成一部连续电影。这能确保无缝衔接,无需手动重新加载图像。