Lying on side

详情

模型描述

版本 2.0 更新:
在我将图像明亮或暗部中有时出现的网格图案与使用 OneTrainer 进行的 fp4 训练联系起来后,我转为使用 fp8 训练,从而消除了该图案。但为了修正所有 LoRA,我不得不重新训练全部内容。数据集中包含两种不同的姿势:一种是人物通过手肘支撑抬起上半身(不是伸直的手掌,那属于 Lean to Side);另一种是人物平躺于地面,常将头部倚在手上。这两种姿势无法合并为一个 LoRA,因此我将它们分成了两个,本版本为原始的支撑抬升姿势。因此,关键词是 lying on sideleaning on elbow。和以往一样,使用类似 lora:LyingOnSide-step00600:1 的 LoRA 标签可能会有帮助。

附加说明:我花费了大量时间制作了数十张测试图像,以确定哪个训练轮次能产生最佳效果。发布后,我尝试用新提示生成一张竖版图像,结果 20 轮次版本完全失败。即使我不想这样做,我也必须改用接近成功的 25 轮次版本。请自行决定。


Flux 在生成平躺姿势方面表现极差。我唯一成功获得的姿势是俯卧,但脚部却出现问题。我最初尝试制作一个全能方案,但经过大量测试后,不得不将每种姿势分别训练为独立的 LoRA。

我还发现,必须使用 lora:LyingOnSide-150:1 标签,否则是否影响图像几乎全靠运气。训练语句为 "lying on her side"。此处两种变体实际整合在一个 LoRA 中,但控制力较弱:要么更倾斜支撑,要么更低,头部倚在手上。你可以尝试 "her head is resting on her hand" 或 "is leaning on her elbow",这是我所采用的标注方案。


我在这里开始尝试,但必须拆分为独立 LoRA 才能正常工作的,是对面部角度、身体角度、摄像机角度和图像区域的精细控制。不过从本版本开始,标注方式已保持一致,为后续工作做好准备,即使它们目前还不能独立生效。标注方案如下:

面部角度:
正脸 | 四分之三脸 | 三分之二脸 | 侧脸

身体角度:
正面视角 | 四分之三视角 | 侧面视角 | 四分之三背面视角

摄像机角度:
俯拍 | 平视 | 仰拍 | 肩部高度 | 牛仔镜头 | 地面视角

图像区域:
全身肖像 | 四分之三身肖像 | 半身肖像 | 四分之一身肖像

如果我能最终实现这一目标,那就太棒了!

此模型生成的图像

未找到图像。