我有5个视频,每个视频60帧(25FPS),从中截取了大量特写镜头,然后为全身示例添加了带有策略性省略的自然字幕,为特写镜头添加了紧凑且受控的部分字幕。学习率设为4e-5,这是我逐渐稳定下来的数值,训练约80个周期。第50个周期似乎是运动效果的最佳点,但进行一些种子搜索仍会有帮助。
展示视频均包含元数据。
如需了解更多关于我这种训练方法的细节,请查看我的训练文章。