データセット: 224枚の画像 / 50の複数ビュー、17枚のアニメスクリーンショット、10枚のグレースケール、5枚のスケッチ。JPEGアーチファクトを除去するためにアップスケール済み。
誤って「anime screenshot」タグが付けられていた。本来は「anime screencap」であるべきだが、illustriousの学習後にDanbooruがタグ名を変更し、後になって気づいた。
ベーススタイル用のトリガー語はなし。
4回の失敗と数え切れないほどのバズを費やした後、意外と良い出来になったと思うが、さらに改善の余地はある。
手がおかしくなったのは、おそらく指先が1本だけ露出した手袋の影響と思われる。
すべての手を上げている画像にタグを付けるのを忘れてしまったため、「手を上げる」傾向が生じた。
いくつかの髪型タグも見落としていた。
スケッチ・スクリーンキャプ・グレースケールがスタイルにどの程度影響を与えるかわからなかった。もっと追加すべきだったかもしれない。
普段通り、捕捉したかった多くの細部(乳首ピアス、へそピアス、イヤリング、チョーカー、Oリング)は無視された。これらはクロップとして追加すべきだろう。
{
"engine": "kohya",
"unetLR": 0.0005,
"clipSkip": 1,
"loraType": "lora",
"keepTokens": 0,
"networkDim": 32,
"numRepeats": 3,
"resolution": 1024,
"lrScheduler": "cosine_with_restarts",
"minSnrGamma": 5,
"noiseOffset": 0,
"targetSteps": 3360,
"enableBucket": true,
"networkAlpha": 16,
"optimizerType": "Adafactor",
"textEncoderLR": 0.00005,
"maxTrainEpochs": 20,
"shuffleCaption": true,
"trainBatchSize": 4,
"flipAugmentation": false,
"lrSchedulerNumCycles": 3
}