데이터셋: 224장의 이미지 / 50개의 다중 시점, 17개의 애니메이션 스크린샷, 10개의 그레이스케일, 5개의 스케치. JPEG 아티팩트를 제거하기 위해 업스케일링함.
오류로 "anime screenshot" 태그가 붙었습니다. 올바른 태그는 "anime screencap"이어야 했지만, Illustrious가 학습된 이후 Danbooru가 태그 이름을 변경했고, 저는 나중에야 이를 인지했습니다.
기본 스타일에 트리거 단어가 없습니다.
4번의 실패와 수천 번의 버즈 소비 끝에 꽤 괜찮은 결과가 나왔다고 생각하지만, 더 나아질 수 있습니다.
손이 망가진 것은 아마도 손가락이 하나만露出된 핸드레스 장갑이 일부 포함되어서일 것입니다.
모든 사진에 손을 위로 들어 올린 장면이 있었지만 태그를 잊어버려서 "hand up" 경향이 생겼습니다.
일부 헤어스타일 태그도 빠졌습니다.
스케치/스크린캡/그레이스케일이 스타일에 얼마나 영향을 미칠지 확신이 서지 않았습니다. 더 추가했어야 했습니다.
보통처럼 캡처하고 싶었던 많은 디테일들이 무시되었습니다. 유두 피어싱, 배꼽 피어싱, 귀걸이, 초커, O-링. 이들에 대해 크롭으로 추가해야 했습니다.
{
"engine": "kohya",
"unetLR": 0.0005,
"clipSkip": 1,
"loraType": "lora",
"keepTokens": 0,
"networkDim": 32,
"numRepeats": 3,
"resolution": 1024,
"lrScheduler": "cosine_with_restarts",
"minSnrGamma": 5,
"noiseOffset": 0,
"targetSteps": 3360,
"enableBucket": true,
"networkAlpha": 16,
"optimizerType": "Adafactor",
"textEncoderLR": 0.00005,
"maxTrainEpochs": 20,
"shuffleCaption": true,
"trainBatchSize": 4,
"flipAugmentation": false,
"lrSchedulerNumCycles": 3
}