Wan2.2+14B+Sage + TorchCompile + LLM AutoPrompt Workflow

此 ComfyUI 工作流是一个用于从单张图像生成视频（图像到视频）的高级流水线。它利用 Wan2.2 14B 模型 的强大能力进行核心视频合成，并通过多项高级功能提升性能与创作控制力。

一个关键特性是集成了 LLM AutoPrompt 节点，可自动生成详细且动态的提示词，以引导视频创作过程。工作流还整合了 Sage Attention 和 Torch Compile 两种高级优化技术。Sage Attention 提供了更高效稳定的注意力机制，特别有利于高分辨率视频生成；而 Torch Compile 通过将 PyTorch 代码编译为更优化的表示形式，显著加快模型的执行速度。

该工作流的结构如下：首先接收用户提供的图像，随后使用 LLM 根据图像内容生成描述性提示词。此生成的提示词与初始图像一同输入 Wan2.2 模型，以生成最终的视频输出。

使用建议

为有效使用本工作流，请遵循以下建议：

输入图像：首先将您希望使用的起始图像加载到指定的“LoadImage”节点中。该工作流旨在对静态图像进行动画化处理，因此清晰明确的主体将获得最佳效果。
LLM AutoPrompt：LLM AutoPrompt 节点已配置为自动生成影响视频叙事与动作的文本提示。您可通过修改 system_msg 输入来定制 LLM 的行为，以引导生成提示的风格与内容。如需更直接的控制，您也可跳过 LLM，直接输入自定义的描述性提示。
模型与性能设置：
- 本工作流默认配置为使用 Wan2.2 14B 模型。请确保已下载正确的模型文件，并放置于您的 ComfyUI models/unet 目录中。
- Sage Attention 和 Torch Compile 默认启用以优化性能。对大多数用户而言，默认设置可在速度与质量之间取得良好平衡。如遇问题，可尝试禁用这些节点，但需注意生成时间将显著增加。
输出：最终输出为视频文件。您可在“VHS_VideoCombine”节点中调整视频的尺寸、帧率及其他参数，以满足您的需求。

本工作流非常适合希望借助自动化与创意提示，从静态图像生成高质量视频内容的用户，同时充分利用了先进的性能优化技术。

工作流中使用的非标准节点：

https://github.com/city96/ComfyUI-GGUF

https://github.com/pollockjj/ComfyUI-MultiGPU

可选 https://github.com/gokayfem/ComfyUI_VLM_nodes

模型类型	工作流
基础模型	Wan Video 14B i2v 720p
发布时间	7/29/2025

Wan2.2+14B+Sage + TorchCompile + LLM AutoPrompt Workflow

详情

下载文件

模型描述

使用建议

此模型生成的图像