Hunyuan Video / Wan LoRA training toolkit
详情
下载文件
模型描述
为 LoRAs 准备数据集可能非常麻烦。由于我比较懒,我尝试尽可能自动化这个过程。
首先,我有一个工作流,可以从文件夹中提取视频,并将其帧率转换为你选择的目标帧率(默认为 Hunyuan 的 24 fps)。为此,它会计算原始帧率和目标帧率的最小公倍数(lcm)(例如,30 和 24 的最小公倍数是 120),然后使用 FILM 在这两个数的最小公倍数范围内进行插值,再仅保留所需帧以降回目标帧率。这有点过度处理,但如果你的电脑能处理,它确实能省去一些麻烦。
我不得不为数学运算创建一个自定义节点,如果管理器找不到它,请使用这个:https://github.com/EmilioPlumed/ComfyUI-Math。
其次,我有另一个工作流,用于为文件夹中的视频添加字幕。我配置它使用 Joy Captioner alpha 2 获取详细的描述,并使用两个 wd14 标签生成器从不同位置提取标签。三个字幕中的每一个都有一个滑块,用于选择从视频的哪个部分提取描述或标签。然后,它会消除重复的标签,并将文本合并到一个 .txt 文件中。
这些工作流要求你将文件重命名为连续编号。
