Flux.1 D - Creepy Stuff

详情

模型描述

很可能这是目前Flux的最后一个模型了,除非出现什么有趣的新发展。原因有很多,但最主要的是我怀念SDXL和Pony模型的那种随机性,那才是最有趣的。一边悠闲地听音乐,一边拆解歌词,看看会生成出什么——这种体验Flux根本做不到。此外,生成一张图所需的资源和时间实在太多了,尤其是现在。再加上几个LoRA、提高CFG值,内存占用和生成时间就直接飙升了。在Flux生成一张图的时间里,我用SDXL配合高分辨率修复早已生成了一组10张图。我仍会偶尔使用它,但不会作为主要工具。

促使我开始尝试Flux的,主要是好奇心和不断撞墙的执念。Flux确实有很多优势,但经过更深入的了解后,我发现它在行为方式上与我期望或希望它做到的效果存在根本性冲突:它缺乏灵活性,即使使用LoRA和随机种子,仍会默认输出某些固定图像和风格;存在概念渗漏(在某些情况下这未必是坏事);一些插件无法使用(要么不支持,要么Forge中的Gradio版本有问题);对相机角度的理解有限;即使生成写实图像,也常带有卡通化的虚假感;噪声、颗粒、雾气等效果受限,诸如此类。

然而,Flux的强项在于:非常擅长风格化表现,生成图像干净,能将糟糕的训练图转化为有用的结果;大部分情况下解剖结构准确,色彩与对比度表现良好,整体连贯性强,文本编码器也出色。

这个模型并非基于默认的Flux模型训练,而是基于这个模型:/model/843551/fluxdev-dedistilled?modelVersionId=943787。它有什么不同吗?我不知道。我本打算用两个版本分别训练相同的LoRA做对比,但最终懒得去做了。不过,我还是要劝阻那些想用这个LoRA配合网站生成器的人,除非你愿意把宝贵算力浪费在可能无效的尝试上。

目前有不少类似的LoRA(比如万圣节主题),它们的效果可能更好。虽然我发布的图片看起来都很相似,但实际上我用过多种不同风格和主题的图像,有些甚至和恐怖完全无关。我只是把当前的万圣节素材作为主要测试对象,以验证一些想法或直觉而已。

祝好运!

PS:我画廊中之前的一些图片,基本上是用同一个LoRA生成的,只是在Kohya中的设置和步数不同。

此模型生成的图像

未找到图像。