Wan Img2Video MultiGPU

已弃用：
请使用 /model/1820946/wan2214bsage-torchcompile-llm-autoprompt-workflow

Wan Img2Video 多GPU 工作流是一种强大且高效的方案，用于基于 Wan 2.1 模型（一种领先的视频基础模型）从单张图像生成视频。该工作流通常在 ComfyUI 框架中实现，提供基于节点的界面来管理视频生成过程中的各个组件。多GPU设计对于处理 Wan 模型（如 140 亿参数版本）的高计算需求至关重要。

以下是典型工作流的分解及多GPU的利用方式：

1. 工作流初始化与数据加载：

流程从加载输入图像和必要模型开始。
关键组件包括“加载图像”节点和“加载 WanVideo”节点，用于将图像和视频基础模型引入工作流。
“WanVideo 加载器”和“WanVideo 文本解码器”节点用于加载并配置特定模型、参数及 LoRA（如使用）。

2. 多GPU 分布：

为优化性能并克服显存限制，计算负载被分配到多个 GPU 上，这正是多GPU工作流的亮点所在。
模型的不同组件可卸载至独立的 GPU。例如：
- GPU 1：可能专用于加载大型扩散模型（Wan 2.1 模型的核心）。
- GPU 2：可用于 CLIP 文本编码器，处理指导视频生成的文本提示。这是工作流中非常重要的一部分，可能消耗大量显存。
- GPU 3、GPU 4 等：其他 GPU 可用于处理管道中的其他部分，例如用于编解码的 VAE（变分自编码器），或特定的采样操作。

3. 视频生成过程：

提示与参数设置：用户提供文本提示以引导视频的运动和内容，并设置关键视频参数，例如 num_frames（视频长度）和 frame_rate（帧率）。
扩散过程：生成的核心是扩散过程。模型从输入图像的潜在空间表示开始，在文本提示的引导下逐步添加时间信息。这是一个高度可并行化的任务，使用多个 GPU 能够并发处理该过程的不同部分。
时间与空间一致性：Wan 2.1 采用创新的 3D 因果 VAE 架构，专为视频生成设计，能高效压缩时空信息，确保帧间一致性并保留细节。
视频合成：扩散过程完成后，最终帧从潜在空间合成并解码为视频。

4. 多GPU 方案的关键优势：

突破显存限制：大规模 Wan 2.1 模型（如 140 亿参数）可能需要大量显存（超过 20GB）。将模型组件分布于多个 GPU 上，使得在单 GPU 无法运行这些模型的系统上也能顺利执行。
更快的推理速度：通过并行化计算负载，多GPU工作流显著缩短了视频生成时间，尤其对于高分辨率、长时长视频至关重要。
提升质量：使用更大模型和更高分辨率变得更加可行，从而生成质量更高、细节更丰富、更稳定的视频输出。

模型类型	工作流
基础模型	Wan Video 14B i2v 720p
发布时间	7/28/2025

详情

下载文件

模型描述

此模型生成的图像