Faputa - Made in Abyss

详情

下载文件

模型描述

价值的体现。

如何使用:

如果你只是想跳舞,不关心准确性,只需在提示中添加嵌入触发器:

FPTA

如果你想更贴近角色本身,请使用完整提示:

(FPTA:1.1), (耳朵后贴,下垂耳:1.1), (深色皮肤女性:1.2), 极深肤色, (蓬松、毛茸茸:1.2), (粉红色耳内:1.2), (额外手臂,四只手臂:1.2), (小鼻子:1.2), (怪物女孩:1.2), (大腿毛、腿部毛、腰部毛、臀部毛:1.2), (白色腿部:1.4), (巨大臀部、粗大腿:1.1), 多条尾巴,肚脐外凸

这些额外内容主要是为了弥补各种不足,老实说,很多部分其实都可以删掉(你可以根据你的CFG调整权重)。稍微提高权重似乎能让头部耳朵等层叠的奇怪效果更准确一些,但附带的问题是,如果加上衣服,金属胸罩可能会出现(我可能会训练一个不带胸罩的版本)。

如果你在意细节

这个嵌入效果已经相当接近了(比你想象中对一个如此小的嵌入来说要好得多),但仍存在一些问题。不过,大多数这些问题在其他该角色的LoRA中也会出现,所以我仍称之为成功。更何况它只有300KB……

腿部毛发是否延伸到腰部,效果不稳定。

这很随机,我也没法真正解决。不过完整提示似乎能稍微缓解这个问题——但大部分时候,这不过是心理作用罢了……

额外手臂大约80%的概率会出现。

我认为我也很难改善这一点,因为人们花了很多时间优化图像生成模型,使其尽量不生成额外手臂和肢体。但话说回来,当它们真的出现时,看到它们各自独立活动(而非简单复制同一姿势)却令人惊喜。真正拥有四只手臂是随机的,三只或六只也很常见,四只也一样。

耳朵很少会竖起来。

我提供给训练器的所有示例中,耳朵都是下垂的,但在生成时,有时它们会立起来。“下垂耳”这个完整提示中的描述,是我试图阻止这种现象的尝试;提高嵌入权重确实能有效解决。但话说回来,这个角色在动画里耳朵本来就是会动的,所以这也不是全然失败。

爪垫和其他“异常”有时会出现
我认为模型因为角色与兽人特征相近,误以为她是兽人,因此有时会在手上生成爪垫……爪子……之类的东西。偶尔这些部位还会颜色异常。

但即便如此,我们拥有的是一个300KB的文件,而不是300MB。这几乎是免费的。

现在,让我们直面房间里的大象……

“为什么用嵌入?LoRA不是更好吗?”

我的问题是:它们真的更好吗?你真的了解LoRA吗?你对嵌入又知道多少?除了“它是旧的训练方法,旧=差”之外?

LoRA适合向现有模型引入新概念。 但在大约75%的情况下,大多数LoRA并没有引入新概念——这些概念其实早已存在于模型中,而嵌入正是用来激活模型中已有的这些内容。

但我听到你说:“但我的老婆独一无二!!!她很特别!” 不幸的是,她可能并不特别如果你仅靠提示就能获得角色40-50%的相似度(“嗯,这有点像X!”),那么嵌入几乎肯定能帮你补足剩下的部分。 用嵌入把你的老婆“变出来”不是魔法,这正是嵌入擅长的事。因为即使你没在模型中明确提到你老婆的名字,模型本身已经对各种形态的“老婆”有了相当清晰的认知。嵌入只是引导模型,如何利用它已有的知识,将你的老婆“具现”出来。

“但概念呢!我没法仅靠提示让她做出我想让她做的那种姿势!嵌入做不到这一点。” 嗯……你可能其实可以。就像模型里有海量的老婆一样,也有海量的老婆在各种姿势下被“干”。之前的规则同样适用:如果用这些数据训练一个嵌入,那个几GB大的模型里,其实已经蕴含了你想要的信息。

衣服、表情、镜头角度、构图、发型——几乎所有东西都一样。

更别说,嵌入仅占用几百KB,而LoRA动辄几百MB。当然,一个200MB的LoRA单独看不算什么,但它们真的会越积越多。如果你没做优化,它们还会严重占用VRAM。SDXL模型本身已经很重了,再加上一堆训练不良、未经优化的LoRA,性能会直接崩掉。更别说那些训练糟糕、风格固化、完全无法调整的LoRA了。嵌入甚至能在同一代的不同模型间更灵活地使用,而LoRA基本只能绑定它所训练的那个模型。

“那既然嵌入这么好,LoRA到底有什么用?”

正如我所说:向模型引入新概念。风格就是绝佳的例子。风格能充分利用LoRA通过新信息“引导”模型的方式,把那些维度用起来。如果你的模型画人像非常出色,但对大象的理解却像中世纪风格(或完全忽略“大象”标签),那么LoRA会表现很好,因为用嵌入去强化“大象”这个概念,通常没什么可利用的信息。如果搭配嵌入使用,效果会更强。

我并不讨厌LoRA,恰恰相反。我只是讨厌它们现在被当作万能钥匙——用来训练模型里任何你无法靠提示实现的东西。“我想让我的老婆这样笑!”——“那就训练个500MB的LoRA吧!” 现在人们居然能接受用200MB+的模型去实现一个3KB嵌入就能完美完成、且毫无副作用(如风格污染)的任务,这太荒谬了。

总而言之,给嵌入一个机会吧,杰克

感谢你们听我这场精神分裂的Ted演讲。

希望你喜欢这个嵌入。

此模型生成的图像

未找到图像。