数据集:26张标记为“写实”的照片,多数为特写或下半身,未展示肚脐或膝盖。大量低分辨率图像经过AI上采样。
8/8 维度/阿尔法,adafactor 1040步/20轮,学习率0.0005,余弦退火并重启3次,SNR gamma为5,无噪声偏移,打乱标记/翻转图像。
应使用更低的学习率。0.0001太低,0.0005又太高,或许3?另外,上采样效果可能不佳,应裁剪掉更多内容。
因为我裁剪得过于彻底,所以在权重为1时不太影响动漫风格,但仍有些许影响;而权重更低时细节严重丢失。我没有太多优质角度的图像,不过它生成第一人称视角(POV)效果还不错,哈哈