Video Sound Generator-Hunyuan Foley-workflow

详情

下载文件

模型描述

您可以点击下方链接直接试用。如果效果良好,您可以将其本地部署。

https://www.runninghub.ai/post/1966507850908512257/?inviteCode=1cqzbf7a

粉丝福利:注册即可领取1000积分,每日登录领取100积分,体验4090!感受48G的超强算力。

这是Hunyuan+Foley,视频声音生成工作流。经测试,其声音生成效果极佳,运行所需显存不高,值得推荐!若对音质有更高要求,可通过增加步数实现。

本地部署安装步骤:

  1. 下载Hunyuan+Foley模型:
    https://huggingface.co/tencent/HunyuanVideo-Foley/tree/main
    存放路径:models\hunyuan_foley
  2. 下载siglip2模型:
    https://huggingface.co/google/siglip2-base-patch16-512/tree/main
    存放路径:models\hunyuan_foley\siglip2
  3. 下载CLAP文本模型:
    https://huggingface.co/laion/larger_clap_general/tree/refs%2Fpr%2F2
    存放路径:models\hunyuan_foley\clap
  4. 安装插件
    https://github.com/vantagewithai/Vantage-HunyuanFoley?tab=readme -ov-file
    存放路径:custom_nodes
  5. 在插件目录(custom_nodes\Vantage HunyuanFoley)中运行命令:
    pip install -r requirements.txt

注意:若在安装依赖过程中出现依赖冲突提示,可尝试运行以下命令:
pip install protobuf==3.19.6 diffusers timm transformers descript-audiotools omegaconf

详情请参考插件原作者的说明。请注意,该模型依赖项繁多,安装难度较高。

此模型生成的图像

未找到图像。