在768分辨率下训练,耳朵位置略微更好。
V2.1:与V2相同,但在768分辨率下训练。耳部位置似乎略有改善,但V2在姿势和全身镜头方面更具灵活性。
V2:质量更优,可选的触发词选项更细致,以便精准选择身体结构。基于SD1.5基础模型在512分辨率下训练,可与其他模型兼容,但与写实风格模型配合效果最佳。
V1:使用18张图片在Hassenblend上训练。可与其他模型兼容。