Flux.1 D - Soothing Atmosphere

详情

模型描述

V.2.0

增加了更多图片和更高的步数。

建议使用较低的强度,否则不知为何你会把一切变成触手怪物。

真希望他们能推出 Flux 的 Pro 版本,因为这种蒸馏版很难控制,而且灵活性有限。如果你尝试一些提示词,它总是会生成某种特定图像,或它熟悉且经过训练的内容,从而导致 Flux 典型的“无菌”风格(电影感、照片感、特定动物或人物等)。

我也非常怀疑目前所有已训练的完整检查点是否真的能用。我几乎试过了每一个,但结果总是解剖结构错乱,或存在严重的偏见,而这些偏见无法通过负向提示词或提示词权重来消除,因为 Flux 并不使用这些机制。例如,即使你要求穿衣服,生成的人像也总是裸体的。我不确定这在 SDXL 中是否真的有效过——我很少使用负向提示词,但至少它能帮你去掉一些你想避免的东西。

奇怪的是,所有经过风格训练(如动漫风格)或使用 LoRA 微调的检查点,即使用于生成写实图像,效果也都非常好——我几乎所有的图片都用这类模型(此处未使用,仅以基础 FP8 检查点作展示)……真是令人困惑。


该模型在原本计划用于 SDXL 的数据集上训练,但我从未获得满意的结果。目前仅用少量图像进行了简单测试(仅基础标题),训练步数仅 800 步。后续将改为使用自然语言描述。

最常使用的关键词应为:氛围感情绪化宁静舒缓平和神秘……以及 杂项(那些没有标题的图片……呃,这其实也算一个标题了,忘了 Kohya 在没有 .txt 文件时会自动采用文件夹名称 :D)

  • 顺序:前两张为带 LoRA / 不带 LoRA,之后顺序反转

  • 在特定情况下影响较大/较小(目前如此)

我测试了自己制作的多个 Flux LoRA,结果非常疯狂。即使仅训练 100–200 步,模型就已掌握概念,基础强度的高低变化影响巨大,但总有一些残留物存在,感觉你似乎能从中“挑选”出训练图像的某些特定部分,而无需使用整张图(例如,你只想保留黄色衣物,其他什么都不要)。

截至目前,我已制作了约 30 个 LoRA(仅用于测试),仅凭几张图片就能实现的效果令人震惊。

也许只是偶然,谁知道呢?

此模型生成的图像

未找到图像。