Feet Up
详情
下载文件
关于此版本
模型描述
版本 2.0 更新:
我不满意,但至少比 1.0 版本好一些。这个 LoRA 是基于包含 71 张有鞋子或袜子的图片和 43 张赤脚图片的数据集创建的。高跟鞋的效果比其他类型的鞋子更好,赤脚也可以接受。它并不完美,平均每四张图中只能生成一到两张勉强可接受的图像。我认为这是我用现有硬件和可用图片所能达到的极限了,我尝试了多种不同的方法。如果要猜测的话,可能需要额外几百张图片,训练约 100 个 epoch 才能稳定运行——这超出了我的能力范围。
这个 LoRA 真是难搞。我尝试生成一个人俯卧、双脚朝上的图像,但 Flux 完全不知道该如何处理脚部。赤脚还勉强能接受,但穿鞋就完全不行了。
我试过多个样本集和方法,甚至用过 rank 32、93 张图片、300 个 epoch——在 4060Ti 上以 2.54 张/秒的速度计算,你知道这花了多长时间。更糟的是:即使成功了,图像也会被“溢出”。我早就把图片裁剪成只保留下半身和脚部,以防止 LoRA 影响面部。最后一次尝试只用了 rank 4 和 100 个 epoch,效果好得多。
在开发和测试过程中,我见过的畸形脚部可能比任何在世的整形外科医生都多。即便如此,它的效果依然勉强。对于鞋子,需要约 0.9 的强度;赤脚则需要低得多,大约 0.5。不幸的是,很难判断你偏离的方向在哪里。如果你生成了太多腿、脚或脚底出现在奇怪位置,那就降低强度。鞋子太大也不行,但鞋子变形则说明强度太弱。
我使用了“脚向上”“腿向上”“可见脚底”作为训练提示,因为问题的一部分似乎源于缺乏脚底的训练数据——而脚底通常在图像中是不可见的。



