Flux Full Suite
详情
下载文件
模型描述
此处可找到 LatentSync 的更快版本。
GeekyGhost/ComfyUI-Geeky-LatentSyncWrapper: 带有一些改进的 Latent Sync 的 ComfyUI 封装器。
这是经过代码优化的 1.5 模型。
本展示中的所有素材均使用此工作流制作。我使用 Flux Krea 生成初始图像,用 Wan LCM 进行动画处理,用 MMAudio 添加音效,用 Ace Step 创作音乐,使用 LatentSync 结合 Kokoro TTS 生成的音频实现口型同步,最后在视频编辑器中将所有元素整合并导出。我尽力展示了每个创建并叠加的素材。
你好,这是我的完整 Flux 工作流。它使用了我为通用图像生成制作的自定义 flux schnell 模型,一个用于 img2img 编辑的 flux kontext 组,以及一个使用 flux dev fill 进行内补和外补的组。我使用了量化版本,因为大版本对我的笔记本来说有点吃力。
我还使用 Reactor 设置了一个面部修复和替换组,用于图像和视频。你可能会遇到 onnyx 问题,请查阅仓库获取支持,或直接删除这些模块。
接下来是用于口型同步的 LatentSync。它接受视频和音频输入,生成口型同步视频。我已将其设置为:将口型同步过程中裁剪掉的视频部分在最后重新添加回来,以实现平滑过渡。然后进行面部修复或替换处理。
我添加了我的 Kokoro TTS 节点,以防你没有自己的 TTS。如不需要,可直接删除。它包含一个小型语音修改节点。
我添加了 MMAudio,用于通过文本输入和视频输入生成音效及其他视频音频。
添加了 Wan 用于视频生成。有一些 gguf 模型在本地使用 5 步即可快速运行并获得不错的质量。
添加了 Ace Step 用于音乐生成,以及 Stable Audio 以提供更多音频选项。
添加了我的 Geeky Remb 节点。


