crying_with_tears_flux
详情
下载文件
模型描述
V2.0
特别感谢:
数据集可下载(26张图像)。工作流程与V1.0类似,但我更改了生成的模型,以获得动漫风格的训练数据集。通过添加额外的提示,您可以调整姿势(向上/向下看、微笑等)。
我发现了一点:当我使用写实风格的训练数据时,LoRA可以生成写实照片,但很难生成动漫风格的图像(即使添加了“动漫”提示)。另一方面,使用动漫训练数据效果很好。在生成时添加“照片写实”提示,可以避免产生动漫风格。
(我在训练数据中添加了“动漫风格”标签,可能产生了影响?)
{
"engine": "kohya",
"unetLR": 1,
"clipSkip": 1,
"loraType": "lora",
"keepTokens": 0,
"networkDim": 2,
"numRepeats": 6,
"resolution": 512,
"lrScheduler": "cosine",
"minSnrGamma": 5,
"noiseOffset": 0.1,
"targetSteps": 1040,
"enableBucket": true,
"networkAlpha": 12,
"optimizerType": "Prodigy",
"textEncoderLR": 0,
"maxTrainEpochs": 20,
"shuffleCaption": false,
"trainBatchSize": 3,
"flipAugmentation": false,
"lrSchedulerNumCycles": 3
}

最终,我选择了第18个epoch的模型进行发布。
V1.0
特别感谢:
数据集可下载(27张图像),由上述两个模型生成(1024×1024,后缩小至512×512)。接着我使用WebUI中的工具进行自动标注,并基于这些自动生成的标签,用自然语言手动重新标注。最后,使用此LoRA,通过添加额外提示,您可以调整姿势(向上/向下看、咧嘴笑、微笑、闭嘴等)。
训练参数:
{
"engine": "kohya",
"unetLR": 1,
"clipSkip": 1,
"loraType": "lora",
"keepTokens": 0,
"networkDim": 2,
"numRepeats": 6,
"resolution": 512,
"lrScheduler": "cosine",
"minSnrGamma": 5,
"noiseOffset": 0.1,
"targetSteps": 1080,
"enableBucket": true,
"networkAlpha": 12,
"optimizerType": "Prodigy",
"textEncoderLR": 0,
"maxTrainEpochs": 20,
"shuffleCaption": false,
"trainBatchSize": 3,
"flipAugmentation": false,
"lrSchedulerNumCycles": 3
}

我认为最终的epoch比第19个epoch略好,因此我选择了最终版本。








