Flux Regularization images and txt captions generator with Dynamic and Wildcard - ComfyUI
详情
下载文件
关于此版本
模型描述
这将生成随机多样化的真人图像(男女,各年龄段),服装以身体上半部和衬衫为重点。你可以按需修改动态提示。
在50%的图像中,衬衫上会随机生成一段文字和一个随机数字,以尝试保留Flux的文字生成能力。
同时也会生成随机的宽高比。我不确定这是否理想,但我认为,当所有训练器都支持多尺寸桶时,仅用1:1进行训练显然是个糟糕的主意。系统将生成10倍于其他比例的1:1图像。
我也会上传我的通配符文件夹,以配合我的动态提示使用。
我已经用这个工作流生成了180张图片的文件夹。如果有人需要,请联系我。我不会上传它,因为其中包含穿着衣服的未成年人图像,这违反了Civitai的规则。我可能会继续生成更多,但目前就这些。
请使用ComfyUI的永久队列功能。
要使用本工作流,请记得更新并安装所有缺失的节点等。
本工作流基于并扩展了 @TheGreatOne321 的工作流:/model/646449/regularization-image-workflow-and-collection-for-flux
当前的动态提示如下(我持续在修改):
高清晰度 {8::色彩分级|黑白|复古} 专业 __collections/devilkkw/composition/image_composition_angle_perspective_depth__ 摄影,__collections/devilkkw/composition/image_composition_framing_body__ 视角下的 {0.5::丰满|0.5::健壮|0.5::瘦削|0.2::肥胖|} __yetanotherwildcardcollection-main/states/age__ {0.05::哈里王子|0.05::比尔·盖茨|0.1::埃隆·马斯克|__collections/jumbo/people/nationalities/*__} {男人|女人} 穿着 {长袖|背心|纽扣|V领|高圆领} {浅色|深色}-__YetAnotherWildcardCollection-main/Colors/Basic__ 衬衫。{坐在地板上|奔跑|躺卧休息于地面},{双臂完全伸展 {向两侧|在身体前方|向上}|双臂置于髋部|双臂指向 {0.2::嘴巴|0.2::鼻子|相机|地面}|双臂置于脑后}{|,衬衫上印有/涂写/绘制了 {浅色|深色}-__YetAnotherWildcardCollection-main/Colors/Basic__ 的文字“{__collections/artists/*__|__common_animals__|__collections/nsp/nsp/fruit__}”和数字“xxx”,风格为}。背景为 __yetanotherwildcardcollection-main/background/*__
我终于开始尝试正则化图像了。为什么?因为这是我第四次训练Flux模型的“腋下汗渍衬衫”(链接),但效果还不够好。虽然不错,但还不够。所以我终于决定尝试这个方法。
正则化图像对我来说一直是个复杂而混乱的话题。
我依然认为,大多数LoRA,尤其是用10-20张高质量图像训练的LoRA,并不需要正则化。但我总是至少准备60张图像,因为我希望拥有灵活性,并真正训练出概念的各个方面。
因此,我的想法是:正则化图像将帮助模型保留其固有的优缺点(如拍摄角度、图像质量、人体解剖结构及所有已有偏见),从而使LoRA能真正影响我想要改变的部分。
我认为,单纯把正则化当作一种抑制方法毫无意义。因此,用与数据集相同的提示词进行训练对我来说没有意义。我的目标是让模型理解:“衬衫” ≠ “带有汗渍的衬衫”。
我也认为,把正则化用作防止“渗漏”的方法完全是胡扯。如果你不想渗漏,直接断开LoRA就行。LoRA不是检查点。
我还将尝试用我的Loïc Barcourt LoRA,目的是恢复模型的原始质量。它从我使用的近200张屏幕截图和一些低分辨率图像中学习得太多了——即使所有这些图片都被标注为“低质量”,它们的缺陷仍被作为LoRA权重学习了进去。LoRA通过重复来学习,不论提示词如何。这本就是预料之中的。因此,我认为正则化可以拯救那些学到了低质量、JPEG伪影、奇怪角度等问题的LoRA。





