crying_with_tears_flux

详情

模型描述

V2.0

特别感谢:

数据集可下载(26张图像)。工作流程与V1.0类似,但我更改了生成的模型,以获得动漫风格的训练数据集。通过添加额外的提示,您可以调整姿势(向上/向下看、微笑等)。

我发现了一点:当我使用写实风格的训练数据时,LoRA可以生成写实照片,但很难生成动漫风格的图像(即使添加了“动漫”提示)。另一方面,使用动漫训练数据效果很好。在生成时添加“照片写实”提示,可以避免产生动漫风格。

(我在训练数据中添加了“动漫风格”标签,可能产生了影响?)

{
  "engine": "kohya",
  "unetLR": 1,
  "clipSkip": 1,
  "loraType": "lora",
  "keepTokens": 0,
  "networkDim": 2,
  "numRepeats": 6,
  "resolution": 512,
  "lrScheduler": "cosine",
  "minSnrGamma": 5,
  "noiseOffset": 0.1,
  "targetSteps": 1040,
  "enableBucket": true,
  "networkAlpha": 12,
  "optimizerType": "Prodigy",
  "textEncoderLR": 0,
  "maxTrainEpochs": 20,
  "shuffleCaption": false,
  "trainBatchSize": 3,
  "flipAugmentation": false,
  "lrSchedulerNumCycles": 3
}

最终,我选择了第18个epoch的模型进行发布。


V1.0

特别感谢:

数据集可下载(27张图像),由上述两个模型生成(1024×1024,后缩小至512×512)。接着我使用WebUI中的工具进行自动标注,并基于这些自动生成的标签,用自然语言手动重新标注。最后,使用此LoRA,通过添加额外提示,您可以调整姿势(向上/向下看、咧嘴笑、微笑、闭嘴等)。

训练参数:

{
  "engine": "kohya",
  "unetLR": 1,
  "clipSkip": 1,
  "loraType": "lora",
  "keepTokens": 0,
  "networkDim": 2,
  "numRepeats": 6,
  "resolution": 512,
  "lrScheduler": "cosine",
  "minSnrGamma": 5,
  "noiseOffset": 0.1,
  "targetSteps": 1080,
  "enableBucket": true,
  "networkAlpha": 12,
  "optimizerType": "Prodigy",
  "textEncoderLR": 0,
  "maxTrainEpochs": 20,
  "shuffleCaption": false,
  "trainBatchSize": 3,
  "flipAugmentation": false,
  "lrSchedulerNumCycles": 3
}

我认为最终的epoch比第19个epoch略好,因此我选择了最终版本。

此模型生成的图像

未找到图像。