Wan2.1-VACE-14B(pro)

详情

下载文件

模型描述

👑 Wan2.1-VACE-14B (LoRA 加速):通过 CausVid LoRA 实现 3 步视频生成,速度提升 10 倍

🎬 使用 Wan2.1 和 CausVid LoRA,将视频生成速度提升约 10 倍!🎬

📌 概述

Wan2.1-VACE-14B 视频扩散模型,配合 CausVid LoRA 使用,专为高质量、高效率的视频生成而设计。它在 480p 和 720p 分辨率下表现尤为出色,通过简化的 3 步 ComfyUI 流程实现快速生成。本指南将引导您完成设置流程,解锁这一加速视频生成功能,包括全精度模型和量化模型(如快速的 Q3KL GGUF)的选项。

🔑 关键组件

  1. 扩散模型(14B):

    • 全精度:wan2.1_vace_14B_fp16.safetensors(推荐用于与 LoRA 示例兼容)

    • 量化版(Civitai):wan2.1_vace_14B_Q4KM.safetensors

    • 量化版(GGUF - Civitai):wan2.1_vace_14B_Q3kl.gguf(5分钟示例中使用,需 GGUF 加载器)

      这与 Hugging Face 上的 GGUF 格式不同(它们缺失了关键组件!)。我测试过那个版本,它无法用于 vid2vid 任务。因此,我专门开发了适用于 vid2vid 的自有类型,这些模型经过优化并采用不同结构,以确保兼容性和更佳效果。如果您需要其他类型,请在测试 Hugging Face 版本后“留言”!

  2. 性能 LoRA(加速必备):

  3. VAE:

  4. 文本编码器: 任选其一:

📁 文件组织

请将下载的文件置于您的 ComfyUI 目录中,结构如下:

ComfyUI/
├── models/
│   ├── diffusion_models/
│   │   └── wan2.1_vace_14B_fp16.safetensors  # 或 Q4KM.safetensors,或 Q3kl.gguf
│   ├── text_encoders/
│   │   └── umt5_xxl_fp16.safetensors         # 或 fp8 版本
│   ├── loras/
│   │   └── Wan21_CausVid_14B_T2V_lora_rank32.safetensors
│   └── vae/
│       └── wan_2.1_vae.safetensors

🎨 模型展示:快速生成 720p 电影级镜头

此配置结合 Wan2.1-VACE-14B 和 CausVid LoRA,能以惊人速度生成 720p(及 480p)视频片段,使用量化 GGUF 模型时速度更快。它非常适合快速迭代、创意实验和高效内容创作,整个流程仅需 3 步即可完成。

💡 使用提示

  • 模型与 LoRA 配置: 为获得最佳速度与画质,请使用适当的 14B 模型(如 wan2.1_vace_14B_fp16.safetensorswan2.1_vace_14B_Q3kl.gguf)搭配 Wan21_CausVid_14B_T2V_lora_rank32.safetensors LoRA。LoRA 的强度通常建议设为 1.0。

  • 文本编码器: 推荐使用 umt5_xxl_fp16.safetensors 以获得与现有示例和 Kijai 原始演示的最佳兼容性。fp8 版本可节省显存。

  • 分辨率: 该配置专为 480p 和 720p 视频生成优化。

  • 性能提升:

    • 无 LoRA(fp16):在 RTX 4090 上生成一个 81 帧的 720p 视频可能需要约 40 分钟。

    • 使用 CausVid LoRA(fp16):同一视频可在 RTX 4090 上约 4 分钟内生成。

    • 使用 CausVid LoRA + Q3KL GGUF:在具备 GGUF 加载器的硬件上,生成类似输出可能更快,约 5 分钟或更短。

  • 工作流简化: 除速度外,本方案的最大优势在于模型加载后仅需 3 步即可完成生成:1. 输入提示(文本输入),2. KSampler(或带 LoRA 和选定模型的等效节点),3. 视频合成(输出)。

🌟 致谢

Wan 2.1 原始模型由 Comfy-Org 重新打包为 ComfyUI 版本:Hugging Face 上的 Wan 2.1 ComfyUI 重打包版。性能增强型 CausVid LoRAWan21_CausVid_14B_T2V_lora_rank32.safetensors)由 Kijai 提取并分享。原始公告与详情:Kijai 的 Reddit 帖子。量化版 GGUF 和 Safetensors 模型可在 Civitai 上获取,提升可访问性与速度。感谢底层 CausVid 技术 的开发者(推测为 MIT 许可证或类似开源协议)。

👨‍💻 开发者信息

本指南由 Abdallah Al-Swaiti 创建:

  1. Hugging Face

  2. GitHub

  3. LinkedIn

  4. ComfyUI-OllamaGemini

更多工具与更新,请查看我的其他仓库。

✨ 使用 WAN 2.1 VACE 和 Pastel Dream 创作梦幻视频!✨

No alternative text description for this image

此模型生成的图像

未找到图像。