One LoRA controls consistency across multiple roles

详情

模型描述

如果这对您有帮助,您可以关注我的BilibiliYouTube账号。

在ComfyUI中,多角色一致性控制一直是一个挑战。此前,我采用单角色LoRA训练来控制单角色一致性。

随后,我合并了数据集并标注了提示词。然而,所选的提示词标注策略存在语义污染问题,导致模型未能达到预期效果。

标签:

在纯白色背景的照片中,susuxi站在画面左侧,双手叉腰,穿着白色衬衫和黑色裤子,裤子上系着黄色腰带,衬衫上有黄色口袋。表情开心,正在大笑。dreamoo位于画面右侧的上半身照片中,身穿灰色上衣和红色短袖衬衫。

然而,经过测试发现,忽略提示词的区域控制会导致图像中的特征融合。

susuxi和dreamoo在秋千上荡漾,

随后,受到in context lora的启发,我修改了标注方法,增强了Flux模型对图像区域的感知能力。通过使用不同的提示词形式对应图像中不同区域的特征,我完成了LoRA模型的训练!

标签:

[两个不同角色场景],<dreamoo><ssx>合照,<ssx双手叉腰,身穿白色衬衫和黑色裤子,衬衫上有黄色口袋>,<dreamoo身穿灰色上衣,内搭红色衣物,面向右侧>,纯白色背景,

我推荐使用以下方式撰写提示词,并在最终场景中添加同一场景中的多个角色,这将更好地将不同角色融合在同一场景中:

[同一场景中的两个不同角色],<dreamoo><ssx> 描述场景,<使用触发词描述角色一的服装和状态>,<使用触发词描述角色二的服装和状态>,整体场景描述,

以下是测试结果图。从结果可以看出,该模型具有很强的泛化能力,能够保持角色的一致性!

如果结合万像视频生成模型,即可完成视频制作,效果非常出色。

此模型生成的图像

未找到图像。