Hunyuan Video Workflow for High VRAM Savings

详情

模型描述

此工作流仅在 WSL 上进行过测试。如果您需要,可以使用 Triton、Sage Attention 和 Bits and Bytes,但它们不影响内存使用。如果您未安装 Bits and Bytes,请将 TextEncoder 量化设置为“禁用”。如果您不使用 Sage Attention,内存使用量将更高。

您可以将 Enhance-a-Video 节点连接到 feta_args,但根据所用权重的不同,会略微影响内存使用量。您也可以将 LoRA 连接到模型加载器。

影响内存使用量的最大因素是 blockswap 节点。设置得越高,节省的内存越多,生成时间也越长。建议从双块开始,上限为 20。如需更多内存节省,可使用单块,上限为 40。我使用的是 4080 显卡,已在 720x480 分辨率下成功生成近 300 帧,耗时约 25 分钟。您可以通过降低帧数来提高分辨率。显然,24GB 以上的显卡能处理更多内容。

目标是在尽可能降低 blockswaps 的同时,充分利用您的 VRAM 以保持生成速度。例如,不要为 2 秒的视频设置 20/40。仅在需要更多帧数或更高分辨率,且已接近 VRAM 极限时才增加设置。请使用 GPU-Z 等内存监控工具。不要过于接近您的 VRAM 最大值,否则虽然可能不会出现 OOM 错误,但生成速度会远低于正常水平。我有 16GB(16384MB)显存,为保持全速运行,我会尽量保持在 16000MB 以下。一旦略微超过,生成时间可能翻倍甚至更长。

备注框仅供我个人参考,您可以根据需要自行修改。

此模型生成的图像

未找到图像。