数据集:224张图片 / 50个多视角,17张动漫截图,10张灰度图,5张草图。已上采样以消除jpeg伪影。
错误地打上了“anime screenshot”标签,本应是“anime screencap”,但danbooru在illustrious训练后更改了标签名称,我直到后来才意识到。
基础风格没有触发词。
虽然经历了四次失败和无数的算力浪费,但最终效果还不错,不过还能更好。
手部出现错误,可能是因为有些无指手套只留了一个手指的开口。
倾向于生成“手举起来”的姿势,因为我忘记在所有有此姿势的图片中打上相应标签。
也遗漏了一些发型标签。
不确定草图/截图/灰度图会对风格造成多大干扰,可能应该增加更多这类数据。
和往常一样,许多我想要捕捉的细节都被忽略了:乳头穿孔、肚脐穿孔、耳环、项圈、O型环。也许应该将它们作为裁剪图添加。
{
"engine": "kohya",
"unetLR": 0.0005,
"clipSkip": 1,
"loraType": "lora",
"keepTokens": 0,
"networkDim": 32,
"numRepeats": 3,
"resolution": 1024,
"lrScheduler": "cosine_with_restarts",
"minSnrGamma": 5,
"noiseOffset": 0,
"targetSteps": 3360,
"enableBucket": true,
"networkAlpha": 16,
"optimizerType": "Adafactor",
"textEncoderLR": 0.00005,
"maxTrainEpochs": 20,
"shuffleCaption": true,
"trainBatchSize": 4,
"flipAugmentation": false,
"lrSchedulerNumCycles": 3
}