One LoRA controls consistency across multiple roles
详情
下载文件
模型描述
如果这对您有帮助,您可以关注我的Bilibili或YouTube账号。
在ComfyUI中,多角色一致性控制一直是一个挑战。此前,我采用单角色LoRA训练来控制单角色一致性。
随后,我合并了数据集并标注了提示词。然而,所选的提示词标注策略存在语义污染问题,导致模型未能达到预期效果。
标签:
在纯白色背景的照片中,susuxi站在画面左侧,双手叉腰,穿着白色衬衫和黑色裤子,裤子上系着黄色腰带,衬衫上有黄色口袋。表情开心,正在大笑。dreamoo位于画面右侧的上半身照片中,身穿灰色上衣和红色短袖衬衫。

然而,经过测试发现,忽略提示词的区域控制会导致图像中的特征融合。
susuxi和dreamoo在秋千上荡漾,

随后,受到in context lora的启发,我修改了标注方法,增强了Flux模型对图像区域的感知能力。通过使用不同的提示词形式对应图像中不同区域的特征,我完成了LoRA模型的训练!
标签:
[两个不同角色场景],<dreamoo><ssx>合照,<ssx双手叉腰,身穿白色衬衫和黑色裤子,衬衫上有黄色口袋>,<dreamoo身穿灰色上衣,内搭红色衣物,面向右侧>,纯白色背景,
我推荐使用以下方式撰写提示词,并在最终场景中添加同一场景中的多个角色,这将更好地将不同角色融合在同一场景中:
[同一场景中的两个不同角色],<dreamoo><ssx> 描述场景,<使用触发词描述角色一的服装和状态>,<使用触发词描述角色二的服装和状态>,整体场景描述,
以下是测试结果图。从结果可以看出,该模型具有很强的泛化能力,能够保持角色的一致性!

如果结合万像视频生成模型,即可完成视频制作,效果非常出色。












