在极其多样但主题相关的数据集上进行训练。
亚洲模型在950张手工精选的图像上进行训练。
印度模型在75张图像上进行训练,但优先级更高。
拉丁裔模型在150张图像的数据集上进行训练。
正如你所想象的,亚洲模型的训练成本要高得多,将其视为一项关于训练多样性的实验,所有图像均为高清,并以1024x1024分辨率进行训练。