带有标签video image extractor的模型