See-through body | Experimental

详情

模型描述

v2.4

感谢 @Foredev 的建议,这推动了大量的实验。此版本终于产生了比 v1 更令我满意的结果,但我很好奇你们在实际使用中觉得它如何。

完全强化特定特征(如面部表情)的提示,可能会压倒透明效果。降低提示权重,例如 "(smile:0.7)",可以更好地在两种概念之间实现插值。

v2.3

我尝试过改进模型但未成功。此版本减少了部分旧版的伪影,但在生成效果上一致性较差。既然我花这么多精力训练出的都是糟糕的模型,不如干脆发布一个供你们尝试。也许你们能发现它的用途。

v1 - 大型

与 v1 - 正常版使用相同的数据集,但 LoRA 模型尺寸大一倍。结果看起来有希望,欢迎提供您的反馈。

v1 - 正常(推荐)

经过增强的数据集使结果有所提升。但仍存在强烈风格倾向,导致结果偏向动漫风格,且背景出现过拟合。当背景为重复图案(如石墙、混凝土路径)或包含贯穿主体的元素(如窗户、边缘等)时,效果最佳。虽然并未为此专门标注,但在使用 "see-through body" 的同时添加 "see-through head" 可能有助于提升头部的透明度。

在负面提示中添加如 "see-through clothes" 可获得更“隐形女孩”的效果。在负面提示中加入 "tattoo" 也可能解决某些问题。

v0

概念验证:这是通过合成与修改图像训练一个概念的初步验证。初始数据集非常小,生成的模型过于“烧焦”,但已显示出对概念的理解迹象。

方法说明

v0 和 v1 完全基于合成数据训练:通过独立生成主体和背景,再使用图像编辑软件将半透明主体叠加到背景之上。

这种方法的明显缺点是两部分整合不佳。那么,如何让全身主体正确贴合背景的视角呢?我的解决方案是使用我最钟爱的工具——线稿控制网络(lineart controlnet)。

初始提示为:

1girl, standing, full body, turning around, looking back, long blonde hair, red jacket, blue jeans, park, grass, bench, concrete path, masterpiece, best quality, amazing detail, high definition

然后可将其修改为独立主体的提示:

1girl, standing, full body, turning around, looking back, long blonde hair, red jacket, blue jeans, simple background, masterpiece, best quality, amazing detail, high definition

以及背景提示:

no humans, park, grass, bench, concrete path, masterpiece, best quality, amazing detail, high definition

使用简单背景能更轻松地遮罩主体,再将其作为半透明主体叠加到完整细节的背景上。即使使用一个完全不理解“see-through body”概念的模型,我们仍能通过这种方式创建合成训练数据,使其学会该概念。非常巧妙!

在此之前,我根本不确定这种方法是否可行。虽然结果并非惊人,但已优于我的预期。

此模型生成的图像

未找到图像。