带有标签advantage的模型