Influx

详情

下载文件

模型描述

欢迎来到我自定义训练的 SD15 模型。

此模型使用约 6,000 张生成的 flux 图像进行训练,尝试了多种风格(并经历了大量试错)。

数据集来源:

/model/631007?modelVersionId=705402

由于我依赖 _pharmapsychotic -> clip_interrogator 进行自动标注,因此没有严格的标签或描述可遵循——仅采取一种轻松、探索性的方法。

我纯粹出于爱好进行此项目,此前没有任何机器学习经验。

在不断调试、花费大量时间使用 _onetrainer 以及消耗无数精力的过程中,这真是一段奇妙的旅程。但话说回来,总有更多东西值得学习,我也期待进一步优化这个模型。

目前,该模型生成的人脸效果不佳,或者我也说不准。也许一些优秀的提示词创作者可以告诉我。我还需要学习更多。ComfyUI 中的一个调节旋钮对“生成更好提示”帮助极大。

建议将图像从 512x512 使用高分辨率缩放至 768x768,以获得更佳质量。

训练设置:

嗯,

训练配置

  • 轮数(Epochs)100

  • 批量大小(Batch Size):首次训练时为 10 -> 32

  • 梯度累积步数(Gradient Accumulation Steps)1

  • 学习率(Learning Rate)1e-05

  • 权重数据类型(Weight DType)FLOAT_16

  • 输出数据类型(Output DType)FLOAT_16

  • 调度器(Scheduler)CONSTANT

  • 训练设备(Train Device)cuda

  • 训练数据类型(Train DType)BFLOAT_16(回退至 FLOAT_32

  • 注意力机制(Attention Mechanism)SDP

  • 分辨率(Resolution)512

验证与采样

  • 启用验证(Validation Enabled)true

  • 每多少轮验证一次(Validate After)1 (轮次)

  • 每多少步采样一次(Sample After)200 (步数)

  • 采样图像格式(Sample Image Format)PNG

优化器

  • 优化器(Optimizer)ADAMW_8BIT

  • 权重衰减(Weight Decay)0.01

  • Beta10.9

  • Beta20.999

  • 8位块状(8-bit Block-Wise)true

  • 随机舍入(Stochastic Rounding)true

最初以 1e-5 进行训练,随后逐步降低至 5e-5 等。

此模型生成的图像

未找到图像。