Leaning back

详情

模型描述

版本 2.0 更新:

在我将图像明亮或暗部有时出现的网格图案与使用 OneTrainer 进行的 fp4 训练联系起来后,我转为使用 fp8 训练,从而消除了该图案。但我必须重新训练所有我的 LoRA 来修复它们。除了标签现在变为 lora:LeaningBack-step01200:1 外,其他没有任何改变。


在发现 Flux 即使面对绝对安全的内容(SFW)也无法通过提示生成某些姿势后,我尝试解决这个问题。例如,当模型向后倾斜并用手臂支撑自己时,触发词是 "sitting",然后是 "leaning back, supporting herself with her arm"(或 arms)。为了更一致,我还添加了 lora:LeaningBack-50:1 标签。

在版本 2.0 的数据集中包含正面角度图片,但模型倾向于生成侧角度,因为这种姿势最常见的就是侧角度。腿部姿势也是如此:bent sit 最常见,half bent sitbent figure four(一条腿弯曲,另一条腿交叉置于其下)也存在,但无法通过提示触发。很难决定哪个训练轮次最佳——轮次越多控制越强,但也容易出现多余肢体。和以往一样,我选择了折中的 50。我仍在学习中,所需步数和图像数量的变化很大,但似乎某些腿部姿势的 10 到 15 张图片数量不够(整个数据集共 57 张)。未来的疑问是:是进一步拆分 LoRA,分别训练腿部变体,还是为不同腿部姿势(以及可能的摄像机角度等)创建额外的 LoRA,从而形成一种模块化系统。


我最初在这里尝试实现,但最终必须拆分为独立的 LoRA 才能正常工作的,是对面部角度、身体角度、摄像机角度和画面区域的更精细控制。但从这个开始,我已经统一了标注格式作为准备,即使它们目前还不能独立生效。具体方案如下:

面部角度:
正脸 | 三分之四脸 | 三分之二脸 | 侧脸

身体角度:
正面拍摄 | 三分之四角度 | 侧面拍摄 | 三分之四背面角度

摄像机角度:
高角度拍摄 | 眼平拍摄 | 低角度拍摄 | 肩部高度拍摄 | 牛仔镜头 | 地面高度拍摄

画面区域:
全身肖像 | 三分之二身肖像 | 半身肖像 | 四分之一身肖像

如果我能成功实现这些,那就太棒了!


(针对版本 1.0)
我训练时不得不使用未裁剪的图片,因此对脸部和其他部分造成了一定影响。它应能配合类似 "she is leaning back, supporting herself with her right arm" 或 "she is laying on her left side, propping herself up on her left elbow" 的提示词工作。

强度范围在 0.8 到 1.0 之间效果良好——如果出现变形的手或脚,说明强度过高。

此模型生成的图像

未找到图像。