Tomboys for FLUX
详情
下载文件
关于此版本
模型描述
更新3:哦天,现在效果真好!而这一切只需要再多训练几步(精确地说是1万步,基本上是之前的四倍:D)。这让我怀疑,之前的几次尝试是否也适用同样的规律?
更新2:哇,那个带joycaption的尝试真是个惊喜:它在还原数据集中“假小子”形象方面显然是最差的,而且更离谱的是,它似乎还是最“色”的一次尝试(但数据集是SFW的)。也许T5文本编码器真的很难学习新东西,因此增加训练步数会有所帮助,对吧?我们拭目以待!
更新:嗯,我之前怀疑重复瑕疵可能与训练分辨率有关,看来没全错:1024x1024分辨率的版本出现的重复瑕疵明显更少(但偶尔仍有),同时保留了更复杂的背景和更多样的构图。接下来我们看看Flux在使用自然语言描述时表现如何。
经过三次训练后的初步发现:完全无描述的训练数据集与Flux配合效果出奇地好。好到甚至仅仅加入一个描述词(触发词“tomboy”)不仅没有提升效果,反而略微降低了表现。尽管我在第二次展示时不得不做一点精挑细选,也许那只是随机种子运气不佳。
而第三次使用经典Booru风格标签的版本,则完全是另一种体验。一方面,尤其在日光浴图片中,它生成了更优质的环境,如更一致的海滩或泳池等;但另一方面,它也引入了严重的“身体拼贴”问题——虽然还没到SD3那种程度,但我还是在展示中加入了一些不太成功的图片作为参考。看来它更容易生成多个人物,是否与512x512的训练分辨率有关?下次我将用1024x1024分辨率重新训练对比一下。
“Tomboy”是一个复合词,由“tom”和“boy”组合而成。虽然这个词如今用来指代“像男孩的女孩”,但其词源表明其含义已随时间发生巨大变化。根据《牛津英语词典》,1533年时,“tomboy”意为“粗鲁、喧闹或放肆的男孩”;然而到了1570年代,“tomboy”已演变为指“大胆或不检点的女人”;最终在1590年代末至1600年代初,这个词演变为如今的含义:“行为像活泼或吵闹男孩的女孩;一个野性奔放的女孩。”
来自 维基百科
这就是了:假小子,自1600年以来一直在挑战性别刻板印象,同时看起来还帅到爆。更令人惊讶的是,Flux似乎完全不知道“假小子”是什么。但这一切将因这个LoRA(希望如此)而改变。



















