Hunyuan I2V (Image to Video) - Simplest / 12Gb VRAM - Full HD
详情
下载文件
关于此版本
模型描述
我向您展示最简单的 Hunyuan I2V(图像到视频)ComfyUI 工作流,非常适合初学者理解和学习。
此工作流可以轻松扩展,例如添加自动提示或帧插值功能,但为了简洁和易懂,我在这里不添加这些节点……
我的低显存(仅12GB……)技巧隐藏在生成视频的初始分辨率中(恰好是全高清的一半:(1920/1088)/2 = 960/544),然后使用一个经过训练、能恢复低分辨率图像/视频的2倍上采样模型进行放大。
您可以在以下地址获取其中一个模型:https://openmodeldb.info/users/helaman —— 在我的情况下,您可以使用这个:https://openmodeldb.info/models/2x-NomosUni-compact-otf-medium
我还部分使用 fp8_e4m3fn 运行此工作流,采用了 Kijai 提供的 Hunyuan Video 量化版本:https://huggingface.co/Kijai/HunyuanVideo_comfy/blob/main/hunyuan_video_I2V_fp8_e4m3fn.safetensors,并在 ComfyUI 命令行中添加了两个额外参数:--fp8_e4m3fn-unet --fp8_e4m3fn-text-enc,同时将扩散模型加载器的权重类型设为 fp8_e4m3fn(我还启用了 DualClipLoader 节点中的高级选项,将其发送到 CPU 而非 GPU 显存)。
输出文件中,您可能需要将1088像素裁剪至1080像素,以获得纯正的9:16宽高比。如需横向视频,只需在对应节点中交换数字即可 ;)
免责声明:此工作流是基于以下官方 ComfyUI 示例的修改版本:https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/
祝您制作出精彩的视频!
