Influx
详情
下载文件
模型描述
欢迎来到我自定义训练的 SD15 模型。
此模型使用约 6,000 张生成的 flux 图像进行训练,尝试了多种风格(并经历了大量试错)。
数据集来源:
/model/631007?modelVersionId=705402
由于我依赖 _pharmapsychotic -> clip_interrogator 进行自动标注,因此没有严格的标签或描述可遵循——仅采取一种轻松、探索性的方法。
我纯粹出于爱好进行此项目,此前没有任何机器学习经验。
在不断调试、花费大量时间使用 _onetrainer 以及消耗无数精力的过程中,这真是一段奇妙的旅程。但话说回来,总有更多东西值得学习,我也期待进一步优化这个模型。
目前,该模型生成的人脸效果不佳,或者我也说不准。也许一些优秀的提示词创作者可以告诉我。我还需要学习更多。ComfyUI 中的一个调节旋钮对“生成更好提示”帮助极大。
建议将图像从 512x512 使用高分辨率缩放至 768x768,以获得更佳质量。
训练设置:
嗯,
训练配置
轮数(Epochs):
100批量大小(Batch Size):首次训练时为
10 -> 32梯度累积步数(Gradient Accumulation Steps):
1学习率(Learning Rate):
1e-05权重数据类型(Weight DType):
FLOAT_16输出数据类型(Output DType):
FLOAT_16调度器(Scheduler):
CONSTANT训练设备(Train Device):
cuda训练数据类型(Train DType):
BFLOAT_16(回退至FLOAT_32)注意力机制(Attention Mechanism):
SDP分辨率(Resolution):
512
验证与采样
启用验证(Validation Enabled):
true每多少轮验证一次(Validate After):
1(轮次)每多少步采样一次(Sample After):
200(步数)采样图像格式(Sample Image Format):
PNG
优化器
优化器(Optimizer):
ADAMW_8BIT权重衰减(Weight Decay):
0.01Beta1:
0.9Beta2:
0.9998位块状(8-bit Block-Wise):
true随机舍入(Stochastic Rounding):
true
最初以 1e-5 进行训练,随后逐步降低至 5e-5 等。












