danbooru扩展标签标注！

事情是这样的，大部分动漫主题的stable diffusion模型是以danbooru tags作为prompt来训练的。danbooru tags是1个非常大的标签集合，从人物的发型，到鞋子的款式应有尽有。但是它并不是很均衡，其中背景内容的标签往往只占很小1部分，例如标签中包含white hair/black hair/blonde hair等各色头发，但是table就只有table这个标签，没有white table，因此用danbooru tags训练出来的模型就不是很容易画背景。

那如果让mllm来给这些数据打上更加丰富的背景物件标签，是不是就能解决这个问题了呢？

让我们来试1试！