prompt-extend
详情
下载文件
模型描述
Danbooru 扩展标签标注!
事情是这样的,大多数以动漫为主题的 Stable Diffusion 模型都是使用 Danbooru 标签作为提示词进行训练的。Danbooru 标签是一个非常庞大的标签集合,涵盖了从人物发型到鞋款的各类细节。但它并不均衡,其中背景内容的标签往往只占极小部分——例如标签中包含 white hair、black hair、blonde hair 等各种发色,但关于桌子的标签却只有 table,没有 white table 这样的细分。因此,用 Danbooru 标签训练出的模型往往难以准确绘制背景。
那么,如果让 MLLM 为这些数据打上更丰富的背景物体标签,是否就能解决这个问题呢?
让我们来试一试!


