Geeky Ghost Vid2Vid Organized v1

详情

下载文件

模型描述

此工作流专为高级视频处理设计,融合了多种技术,如风格迁移、运动分析、深度估计和帧插值,以生成融合不同来源元素并提升视觉质量的最终视频。

“组旁路”开关可关闭您不需要的功能。

您需要修正ControlNet模型,我在重新整理时犯了个错误,哈哈。我之所以特意标注出来,是因为它目前处于基本可用状态,我怕自己会忘记。

1.5 版本对模型和标签做了一些修正。

2.0 是我最终发布的版本。我对其进行了调整,以符合我所需的效果和输出方式。此工作流旨在改变3D渲染视频及其他视频的风格,我尽可能高效且稳健地为SD 1.5和AnimateDiff 1.5进行了优化。您可以自由定制:若您添加了一个组框,它将自动加入旁路节点,便于轻松开关功能。祝您使用愉快!

2.5 版本新增了音频输入及其他改进。请勿将IP强度或IP图像强度的滑块调至1.0以上,我已将它们移至输入组,因为我经常使用这些参数。

3.0 版本显著改进了vid2vid功能,保留了音频,但去除了“音频转遮罩”功能,因为我无法使其按预期运行。虽然技术上可行,但不符合我的需求。这是最终版本,不会再更新了,哈哈。

4.0 好吧,IP Adapter更新把我搞崩了,哈哈,但结果却是个惊喜。得益于IP Adapter Plus的更新,以及我阅读更新说明后对其工作原理有了更深入的理解,我成功将系统精简至仅需2个ControlNet和2个IP Adapter。您可以调整权重及其他设置(建议阅读IP Adapter更新说明,他们做了大量改动),添加视频、输入提示词、设置LoRA、上传人脸交换图像等。通过“组旁路”开关,可轻松关闭不需要的功能。这是我能做到的最简化、最易用的版本了,这真的是最终、最终、最终版本,哈哈。

工作流中配置的ControlNet:深度、人体姿态、Canny边缘、软边缘

  1. VHS_LoadVideo:将视频文件加载到工作流中,提取帧和音频以供处理。

  2. ImageScale:将图像缩放至所需分辨率,为后续节点的处理做准备。

  3. ControlNetLoader:加载ControlNet模型,用于从视频帧中提取姿态与运动信息。

  4. DepthAnythingPreprocessor & DWPreprocessor:分别对图像进行深度估计和姿态检测的预处理,提升运动与深度数据的质量,以优化动画效果。

  5. Control Net Stacker:合并多个ControlNet,为视频生成全面的运动与姿态数据集。

  6. LoadImage:将静态图像加载至工作流,可用于纹理映射、背景替换或风格迁移中的参考图像。

  7. PrepImageForClipVision:为CLIP处理准备图像,调整其格式与分辨率。

  8. CLIPVisionLoader:加载CLIP模型,用于语义图像理解,可引导风格迁移过程。

  9. IPAdapterModelLoader:加载IP Adapter模型,用于风格迁移,使图像适配特定美学或主题风格。

  10. IPAdapterApplyEncoded:将IP Adapter模型应用于编码,将一张图像的视觉风格迁移到处理后的视频帧上,实现风格转移。

  11. IPAdapterEncoder:使用IP Adapter模型对图像进行编码,为风格迁移过程做准备。

  12. ADE_LoadAnimateDiffModel & ADE_ApplyAnimateDiffModel:加载并应用AnimateDiff模型,用于在视频帧之间创建平滑过渡与动画效果。

  13. ADE_AnimateDiffLoRALoader:加载可与AnimateDiff配合使用的LoRA模型,以增强动画的运动细节与流畅性。

  14. ADE_UseEvolvedSampling:采用进化的采样技术,提升生成动画与过渡的质量。

  15. BatchPromptSchedule:管理文本提示词的调度,引导生成与转换过程,增强生成内容的上下文相关性。

  16. ReActorFaceSwap & FaceRestoreCFWithModel:用于面部处理,ReActorFaceSwap实现人物面部交换,FaceRestoreCFWithModel则修复或增强视频中的面部细节。

  17. FILM VFI:应用帧插值技术,使视频运动更加平滑。

  18. VHS_VideoCombine:将处理后的帧重新组合为视频格式,加入音频,完成最终输出。

  19. KSampler Adv. (Efficient):高级采样节点,采用高效方法处理并优化视频视觉质量。

  20. Efficient Loader:高效加载模型与数据,优化工作流性能。

  21. CR Apply Multi-ControlNet:在视频处理流程中应用多个ControlNet,以增强运动分析与合成效果。

此模型生成的图像

未找到图像。