Smoking a cigarette

详情

下载文件

模型描述

首先:来自一位你完全不认识的互联网陌生人的快速公共服务提示:吸烟有害健康。请不要吸烟。

更新:查看我的 抽烟女性 模型,它在生成吸烟场景时更加稳定。

接下来是描述内容:我通常将此模型以1.0的权重使用,但若与其他LoRA结合,使用0.9甚至0.8的权重会融合得更好。然而,权重越低,模型行为似乎越奇怪。所有图像均标注了smoking,因此应能作为可靠的触发词。使用holding_cigarette标签可使生成更偏向手持香烟的图像,而非嘴含香烟;而with a cigarette in their mouth则应更倾向于生成嘴含香烟的图像。然而,两种情况下,模型有时会完全忽略这些指令,原因尚不明确。添加smoke标签后,生成烟雾的概率会更高,若幸运的话,烟雾甚至可能从人物口中或香烟处飘出。请大量使用负面提示词,以减少常见问题,如手部畸变、图像模糊等。

制作一个用于生成“吸烟”场景的LoRA模型出乎意料地困难。经过多次尝试和数天的GPU训练时间,这是我目前能达到的最佳效果。它远未完美,但大约五次中有一次能生成可用的图像。我注意到Civitai上另有他人尝试制作吸烟类模型,也遇到了类似问题。我认为问题在于“吸烟”包含极多样的姿势、握持方式、香烟品牌样式等,而这些都属于“吸烟”的范畴。我不断加入新图片,希望模型最终能学会识别所有这些变化,最终数据集达到了130张以上。数据集涵盖了不同性别、种族和年龄的人群,不过显然仍有待提升多样性。此前我曾加入过绘画和CG艺术,但仅有少量此类图像就使整个LoRA模型完全偏向生成绘画风格,因此当前数据集仅包含真实人类的照片。数据集中包含香烟在嘴中、在手中、像笔一样握着、夹在指间、一只手拿香烟同时另一只手也拿着、用打火机点烟、用火柴点烟等场景。我还额外使用了一些正则化图像,以帮助模型更准确地学习“香烟”应有的外观(尽管仍然可以加入更多此类图像,但已解决了一些例如香烟看起来像魔法棒的问题)。即便如此,该模型仍难以稳定生成“女性吸烟”这类简单场景的图像,除非搭配大量正负提示词。我已对训练此模型感到疲惫,决定转向其他项目,但未来或许会回来继续优化。若有人接手这个项目,我建议尝试缩小“吸烟”的定义范围——例如,指定一种特定的握持方式,或若希望香烟出现在人物嘴中,则仅使用香烟位于嘴中的图像进行训练。

优势:

  • 通常能生成看起来像香烟的物体。

  • 有时该香烟确实出现在手中或嘴中,与预期一致。

  • 理论上可适用于各种年龄、性别和种族的人群。

  • 通常能较好地生成烟雾,且烟雾有时确实出现在香烟附近。

劣势:

  • 香烟在手上的位置有时很别扭。

  • 常导致手部畸变,似乎让模型“忘记”了手部应有的正常形态。

  • 有时会把一两个手指变成香烟。

  • 有时会移除另一只手原本持有的对象(如手机)(可尝试将权重降至0.9或0.8以缓解此问题)。

  • 有时会生成多个香烟(嘴里一个,手里一个)。

  • 嘴里的香烟角度可能极度奇怪,甚至未与嘴唇对齐。

  • 香烟通常未点燃,或没有烟灰。

  • 生成的烟雾位置有时错误(例如香烟在嘴中时,烟雾却出现在手上,或出现在某个随机位置)。

与可修复手部问题的TI模型结合使用,可能有助于改善部分手部畸变问题。

此模型生成的图像

未找到图像。