データセット: 実写風とタグ付けされた26枚の写真。ほとんどがクローズアップまたは下半身。へそや膝は表示されていない。多数がAIでアップスケールされた低解像度画像。
8/8 dim/alpha、adafactor 1040ステップ/20エポック、学習率0.0005、3回リスタート付きコサイン。SNRガンマ5。ノイズオフセットなし。トークンシャッフル/画像フリップ。
学習率はもう少し低くすべきだった。0.0001は低すぎ、0.0005は高すぎた。おそらく3が適切か?また、アップスケーリングが悪かった可能性もある。もっと多くの要素を切り抜くべきだった。
激しく切り抜いたため、重み1ではアニメスタイルがそれほど乱れないが、わずかに影響する。しかし、低い重みでは細部が著しく失われる。良い角度の画像が十分ではなかったが、POVは比較的よく再現できる。lol