72枚の画像で学習。すべて2倍にリサイズされ、1280x800となったが、バケットは1280x768だった。いくつかを手動でタグ付けし、残りは自動タガーラーを使ってどうなるか確認した。まあまあ良さそうだが、手が時々おかしくなるので、学習率が高すぎたのかもしれない。
後で削除できるか確認するために、トリガー「pixel art」を追加した。トリガーを付けても線がピクセル化してしまうので、使わなかったほうがよかったかもしれない。
{
"engine": "kohya",
"unetLR": 0.0008,
"clipSkip": 1,
"loraType": "lora",
"keepTokens": 0,
"networkDim": 32,
"numRepeats": 3,
"resolution": 1024,
"lrScheduler": "cosine_with_restarts",
"minSnrGamma": 5,
"noiseOffset": 0,
"targetSteps": 1080,
"enableBucket": true,
"networkAlpha": 16,
"optimizerType": "Adafactor",
"textEncoderLR": 0.00002,
"maxTrainEpochs": 20,
"shuffleCaption": true,
"trainBatchSize": 4,
"flipAugmentation": false,
"lrSchedulerNumCycles": 3
}