Underboob Cutout (Flux/F1D)
详情
下载文件
模型描述
仍处于实验和开发中:我已经将 v3.1 调整到能大约一半时间正常工作,并适用于多种服装,但我仍希望找到一个能普遍适用的版本。我还有更多工作要做来改进它,但我觉得对于拥有自己硬件的用户来说,已经足够尝试了。我进行了一些测试,使用站点生成器创建正确裁切的成功率约为50/50。(“失败”的效果看起来正常,只是没有裁切效果)。如果你是为了生成商业用途的内容,我建议暂时不要使用这个版本,除非你有大量冗余资源。似乎使用 Flux LoRAs 时,耐心并遵循迭代流程至关重要。
触发词:ubcutout,窄裁切,大裁切,单裁切,分开裁切
训练笔记
v6.0
我正在进行更全面的测试,以识别用于上衣风格的模块
种子:400x400 1851087289
主要模块:7 9 10, 11!, 12
次要模块:8 13(姿态?)22
v5.0
还可以,不如 3.1 稳定,但也不算差,如果我能获得更强的版本,我会上传
与 3.1 完全相同的设置,仅使用单模块转换器 5,8,9,10
使用来自 4.0 的新数据集
v4.0(失败/崩溃)
崩溃了,训练进行到三分之一时(与样本图像有关),我没有开启保存中断恢复数据,因此只能用第一个 epoch 来测试
使用 3.1 生成了一些新数据,以改进服装纹理/材质
替换了过度平滑或明显上采样的数据集图像
替换了少量背景为白色的图像
使用余弦调度,重复3次,T_Max = 402??
- 我是不是搞错了?这应该是训练步数的1/3吧?
学习率恢复为 0.0001
使用正则化图像
数据集共 67 张图像,总训练步数 4020
v3.1
与 3.0 相同,但使用余弦学习率
- (下次需要找到正确的配置,以实现带重复的余弦调度)
v3
数据集调整为 50 张图像,剔除差图并添加了更好的图像
简化了现有标签,并新增了对
large cutout、narrow cutout、zipper cutout、single cutout、separate cutouts的支持学习率略微提高至 1.2e-4
在 e1400 时降低至 0.5e-4(e2000 左右开始出现过训练迹象)
这样做效果不佳,下次我应该在开始出现烧灼迹象时就调整,或彻底更改学习率/调度策略
经测试,e2400 实际上效果不错,也许我应该让它多训练一会儿
rank/alpha 降低至 8(约85MB),对于服装风格 LoRA 可能比实际需要的更大
训练步数:4000
v2
基本采用默认的 ai-toolkit 设置
我认为如果我在相同设置下训练更长时间,它应该能工作,目前大约10%的时间能实现期望效果,且副作用极小
- 倾向于简化织物纹理,难以让织物清晰对焦




















