C00M - Cum [Flux]

详情

下载文件

模型描述

这可能是到目前为止我最满意的结果!

使用84张手动挑选并裁剪的图片进行训练,所有图片均为1024*1024分辨率。描述文字简单而极简,虽然处理得比较随意,但准确无误。我引入了一个单独的标记作为触发词,并将其置于描述的中间:

  • «Photo of a woman with C00M on her »,后接简短而简单的上下文提示,如 «face and in her mouth.»。

这似乎让模型对C00M是什么有了非常清晰的认知,并使其能够泛化到完全不同于训练数据的场景中。

训练图片中没有一张包含完整的面部。大多数仅占面部的30%左右,但有几张稍多一些,可能达到45%。这似乎让它能较好地配合角色LoRA,但我尚未充分测试。

与往常一样,使用Flux时,较低的引导值配合更多标记能获得更好的真实感,而较高的引导值则能更好地遵循提示,但代价是更明显的AI风格感。

由于我没有GPU,大部分时间我都是用手机在HF上尝试扩散模型。由于我的手机保存输出时为.jpg格式且不嵌入元数据,因此图库中的照片不幸都没有这些信息。唯一的例外是此处Civitai训练运行输出的正方形图片。

如果你想知道,以下是生成信息:

  • 基础模型:Camenduru/Flux.1-dev-diffusers,我不确定这与普通base dev版本是否有区别,还是只是镜像。

  • 采样器/调度器:我不知道

  • 步数:28

  • 引导值:2-3.5

  • LoRA强度:1.15

提示词略有不同。有时我会加入«opalescent stringy blobs of C00M»或«a mix of chunky blobs and thick viscous liquid C00M»,但仅用C00M本身效果就很好。

它似乎并不想生成真正填满嘴巴的效果,只会在舌头和滴落时出现。如果你能实现,请告诉我。

另外,请在下方分享你的生成结果!

训练信息(请告诉我如何改进/调整):

  • 84张图片

  • 8400步

  • 学习率:0.00010

  • 批次大小:2

  • 两个网络均为32

  • 其他选项保持默认

此模型生成的图像

未找到图像。