该模型旨在模仿 lexica aperture v2 模型的风格。
训练数据使用了约5000张从 lexica API 抓取的肖像图及对应提示词。
V1.1 版本是在人工筛选相同图像集后,仅保留其中最好的3000张图像后进行训练的。