带有标签captioner的模型