Wan2.2+14B+Sage + TorchCompile + LLM AutoPrompt Workflow
详情
下载文件
模型描述
此 ComfyUI 工作流是一个用于从单张图像生成视频(图像到视频)的高级流水线。它利用 Wan2.2 14B 模型 的强大能力进行核心视频合成,并通过多项高级功能提升性能与创作控制力。
一个关键特性是集成了 LLM AutoPrompt 节点,可自动生成详细且动态的提示词,以引导视频创作过程。工作流还整合了 Sage Attention 和 Torch Compile 两种高级优化技术。Sage Attention 提供了更高效稳定的注意力机制,特别有利于高分辨率视频生成;而 Torch Compile 通过将 PyTorch 代码编译为更优化的表示形式,显著加快模型的执行速度。
该工作流的结构如下:首先接收用户提供的图像,随后使用 LLM 根据图像内容生成描述性提示词。此生成的提示词与初始图像一同输入 Wan2.2 模型,以生成最终的视频输出。
使用建议
为有效使用本工作流,请遵循以下建议:
输入图像:首先将您希望使用的起始图像加载到指定的“LoadImage”节点中。该工作流旨在对静态图像进行动画化处理,因此清晰明确的主体将获得最佳效果。
LLM AutoPrompt:LLM AutoPrompt 节点已配置为自动生成影响视频叙事与动作的文本提示。您可通过修改
system_msg输入来定制 LLM 的行为,以引导生成提示的风格与内容。如需更直接的控制,您也可跳过 LLM,直接输入自定义的描述性提示。模型与性能设置:
本工作流默认配置为使用 Wan2.2 14B 模型。请确保已下载正确的模型文件,并放置于您的 ComfyUI
models/unet目录中。Sage Attention 和 Torch Compile 默认启用以优化性能。对大多数用户而言,默认设置可在速度与质量之间取得良好平衡。如遇问题,可尝试禁用这些节点,但需注意生成时间将显著增加。
输出:最终输出为视频文件。您可在“VHS_VideoCombine”节点中调整视频的尺寸、帧率及其他参数,以满足您的需求。
本工作流非常适合希望借助自动化与创意提示,从静态图像生成高质量视频内容的用户,同时充分利用了先进的性能优化技术。
工作流中使用的非标准节点:
