FramePack 💎 img2vid / txt2vid with LoRa Workflow
详情
下载文件
关于此版本
模型描述
mmaudio 会在后续生成中减缓 CUDA 使用率。我已经通过 git pull 获取了自定义节点……nodiff
1.3 现在是 1.3.1,我移除了 GIMMVIF,并将锐化节点替换为另一个,因为前者会导致内存问题。
请将此工作流视为控制面板,如果你不喜欢设计,就不要下载。以下是截图:

v1.3.1
- 更新了调整图像大小节点
- 为起始图像输入添加了批量加载器
- 添加了“视频转额外选项”
- 添加了独立面部精炼步骤
- 添加了 MMaudio 区域(会将模型加载到 VRAM)
- 为 T2V 添加了视觉分辨率/宽高比选择器
- 修改了帧裁剪节点
- 移除了 GIMMVIF 插值(用于 film_net_fp32)
- 锐化图像节点替换为 sharpen MTB
v1.2.1
- 添加了 GIMMVIF 插值(ds_factor(降采样)设为 0.25 可提高插值速度,但会略微损失质量)
- 添加了通配符处理节点
新增 v1.2
- 清理了提示输入和模型加载器
- 添加了 CLIP VISION 以增强正向提示中的图像细节(下载)
- 添加了 VRAM 清理管理节点
- 同时提供了外部通用输入,用于长度和 latent_window_size
基于 kijai 的工作流,进行自定义和增强:
- 集成了带模型和重缩放器的超分辨率模块
- 集成了带锐化的插值模块
- 支持在采样器之间切换(默认或 F1)
- 支持在模式之间切换(i2v 或 t2v)
- 移除 5 帧(非回环 VHS 从开头移除,回环 VHS 从开头和结尾各移除)——t2v 默认为 40 帧
- 添加了 Reactor 节点用于面部替换/精炼,但由于某种 bug,这些节点会拖慢后续生成速度,如果你觉得影响性能,可自由删除 Reactor 节点……
使用 F1 采样器的文本转视频模式:

将鼠标悬停在 FramePack Text Encode (Timestamped)(F1 的提示)上,查看有关提示时间戳模式的更多信息:

* 如果我遗漏了任何其他自定义节点链接,请告知我以便添加。
此外,当前封装器存在一个 bug:若将 CFG 值调高至 1 以上(默认值),推理时间将变为两倍。唯一修复工作流的方法(即使重启 ComfyUI 也无效)是添加一个全新的采样器并重新连接线路……令人沮丧,但这就是现状。
节点:
最新 Kijai 封装器版本:https://github.com/kijai/ComfyUI-FramePackWrapper.git
F1 采样器:https://github.com/kijai/ComfyUI-FramePackWrapper/pull/14/files
你也可以使用:
https://github.com/ShmuelRonen/ComfyUI-FramePackWrapper_Plus
GIMMVIF:
[https://github.com/kijai/ComfyUI-GIMM-VFI](模型支持自动下载)
模型链接:
https://huggingface.co/Kijai/HunyuanVideo_comfy/blob/main/FramePackI2V_HY_fp8_e4m3fn.safetensors
https://huggingface.co/Kijai/HunyuanVideo_comfy/blob/main/FramePackI2V_HY_bf16.safetensors
sigclip:
https://huggingface.co/Comfy-Org/sigclip_vision_384/tree/main
文本编码器和 VAE:
https://huggingface.co/Comfy-Org/HunyuanVideo_repackaged/tree/main/split_files
