Underboob Cutout (Flux/F1D)

详情

模型描述

仍处于实验和开发中:我已经将 v3.1 调整到能大约一半时间正常工作,并适用于多种服装,但我仍希望找到一个能普遍适用的版本。我还有更多工作要做来改进它,但我觉得对于拥有自己硬件的用户来说,已经足够尝试了。我进行了一些测试,使用站点生成器创建正确裁切的成功率约为50/50。(“失败”的效果看起来正常,只是没有裁切效果)。如果你是为了生成商业用途的内容,我建议暂时不要使用这个版本,除非你有大量冗余资源。似乎使用 Flux LoRAs 时,耐心并遵循迭代流程至关重要。

触发词:ubcutout,窄裁切,大裁切,单裁切,分开裁切

训练笔记

v6.0

  • 我正在进行更全面的测试,以识别用于上衣风格的模块

    • 种子:400x400 1851087289

      • 主要模块:7 9 10, 11!, 12

      • 次要模块:8 13(姿态?)22

v5.0

  • 还可以,不如 3.1 稳定,但也不算差,如果我能获得更强的版本,我会上传

  • 与 3.1 完全相同的设置,仅使用单模块转换器 5,8,9,10

  • 使用来自 4.0 的新数据集

v4.0(失败/崩溃)

  • 崩溃了,训练进行到三分之一时(与样本图像有关),我没有开启保存中断恢复数据,因此只能用第一个 epoch 来测试

  • 使用 3.1 生成了一些新数据,以改进服装纹理/材质

    • 替换了过度平滑或明显上采样的数据集图像

    • 替换了少量背景为白色的图像

  • 使用余弦调度,重复3次,T_Max = 402??

    • 我是不是搞错了?这应该是训练步数的1/3吧?
  • 学习率恢复为 0.0001

  • 使用正则化图像

  • 数据集共 67 张图像,总训练步数 4020

v3.1

  • 与 3.0 相同,但使用余弦学习率

    • (下次需要找到正确的配置,以实现带重复的余弦调度)

v3

  • 数据集调整为 50 张图像,剔除差图并添加了更好的图像

  • 简化了现有标签,并新增了对 large cutoutnarrow cutoutzipper cutoutsingle cutoutseparate cutouts 的支持

  • 学习率略微提高至 1.2e-4

    • 在 e1400 时降低至 0.5e-4(e2000 左右开始出现过训练迹象)

      • 这样做效果不佳,下次我应该在开始出现烧灼迹象时就调整,或彻底更改学习率/调度策略

      • 经测试,e2400 实际上效果不错,也许我应该让它多训练一会儿

  • rank/alpha 降低至 8(约85MB),对于服装风格 LoRA 可能比实际需要的更大

  • 训练步数:4000

v2

  • 基本采用默认的 ai-toolkit 设置

  • 我认为如果我在相同设置下训练更长时间,它应该能工作,目前大约10%的时间能实现期望效果,且副作用极小

    • 倾向于简化织物纹理,难以让织物清晰对焦

此模型生成的图像

未找到图像。