Wan2.1-VACE-14B(pro)
详情
下载文件
模型描述
👑 Wan2.1-VACE-14B (LoRA 加速):通过 CausVid LoRA 实现 3 步视频生成,速度提升 10 倍
🎬 使用 Wan2.1 和 CausVid LoRA,将视频生成速度提升约 10 倍!🎬
📌 概述
Wan2.1-VACE-14B 视频扩散模型,配合 CausVid LoRA 使用,专为高质量、高效率的视频生成而设计。它在 480p 和 720p 分辨率下表现尤为出色,通过简化的 3 步 ComfyUI 流程实现快速生成。本指南将引导您完成设置流程,解锁这一加速视频生成功能,包括全精度模型和量化模型(如快速的 Q3KL GGUF)的选项。
🔑 关键组件
扩散模型(14B):
全精度:wan2.1_vace_14B_fp16.safetensors(推荐用于与 LoRA 示例兼容)
量化版(Civitai):wan2.1_vace_14B_Q4KM.safetensors
量化版(GGUF - Civitai):wan2.1_vace_14B_Q3kl.gguf(5分钟示例中使用,需 GGUF 加载器)
这与 Hugging Face 上的 GGUF 格式不同(它们缺失了关键组件!)。我测试过那个版本,它无法用于 vid2vid 任务。因此,我专门开发了适用于 vid2vid 的自有类型,这些模型经过优化并采用不同结构,以确保兼容性和更佳效果。如果您需要其他类型,请在测试 Hugging Face 版本后“留言”!
性能 LoRA(加速必备):
VAE:
文本编码器: 任选其一:
umt5_xxl_fp16.safetensors(推荐,以匹配 Kijai 的 LoRA 工作流封装兼容性)
umt5_xxl_fp8_e4m3fn_scaled.safetensors(更小,fp8 版本)
📁 文件组织
请将下载的文件置于您的 ComfyUI 目录中,结构如下:
ComfyUI/
├── models/
│ ├── diffusion_models/
│ │ └── wan2.1_vace_14B_fp16.safetensors # 或 Q4KM.safetensors,或 Q3kl.gguf
│ ├── text_encoders/
│ │ └── umt5_xxl_fp16.safetensors # 或 fp8 版本
│ ├── loras/
│ │ └── Wan21_CausVid_14B_T2V_lora_rank32.safetensors
│ └── vae/
│ └── wan_2.1_vae.safetensors
🎨 模型展示:快速生成 720p 电影级镜头
此配置结合 Wan2.1-VACE-14B 和 CausVid LoRA,能以惊人速度生成 720p(及 480p)视频片段,使用量化 GGUF 模型时速度更快。它非常适合快速迭代、创意实验和高效内容创作,整个流程仅需 3 步即可完成。
💡 使用提示
模型与 LoRA 配置: 为获得最佳速度与画质,请使用适当的 14B 模型(如
wan2.1_vace_14B_fp16.safetensors或wan2.1_vace_14B_Q3kl.gguf)搭配Wan21_CausVid_14B_T2V_lora_rank32.safetensorsLoRA。LoRA 的强度通常建议设为 1.0。文本编码器: 推荐使用
umt5_xxl_fp16.safetensors以获得与现有示例和 Kijai 原始演示的最佳兼容性。fp8 版本可节省显存。分辨率: 该配置专为 480p 和 720p 视频生成优化。
性能提升:
无 LoRA(fp16):在 RTX 4090 上生成一个 81 帧的 720p 视频可能需要约 40 分钟。
使用 CausVid LoRA(fp16):同一视频可在 RTX 4090 上约 4 分钟内生成。
使用 CausVid LoRA + Q3KL GGUF:在具备 GGUF 加载器的硬件上,生成类似输出可能更快,约 5 分钟或更短。
工作流简化: 除速度外,本方案的最大优势在于模型加载后仅需 3 步即可完成生成:1. 输入提示(文本输入),2. KSampler(或带 LoRA 和选定模型的等效节点),3. 视频合成(输出)。
🌟 致谢
Wan 2.1 原始模型由 Comfy-Org 重新打包为 ComfyUI 版本:Hugging Face 上的 Wan 2.1 ComfyUI 重打包版。性能增强型 CausVid LoRA(Wan21_CausVid_14B_T2V_lora_rank32.safetensors)由 Kijai 提取并分享。原始公告与详情:Kijai 的 Reddit 帖子。量化版 GGUF 和 Safetensors 模型可在 Civitai 上获取,提升可访问性与速度。感谢底层 CausVid 技术 的开发者(推测为 MIT 许可证或类似开源协议)。
👨💻 开发者信息
本指南由 Abdallah Al-Swaiti 创建:
更多工具与更新,请查看我的其他仓库。
✨ 使用 WAN 2.1 VACE 和 Pastel Dream 创作梦幻视频!✨
