Leaning back

세부 정보

파일 다운로드

모델 설명

버전 2.0 업데이트:
이미지의 밝은 부분이나 어두운 부분에 가끔 보이는 격자 패턴이 OneTrainer를 사용한 fp4 학습과 관련이 있다는 것을 알고 나서, fp8 학습으로 전환했고 그 결과 패턴이 사라졌습니다. 그러나 모든 LoRA를 수정하려면 다시 모두 재학습해야 합니다. 내용은 그대로지만 태그만 이제 lora:LeaningBack-step01200:1로 변경되었습니다.


Flux가 어떤 자세를 프롬프트로도 수행하지 못한다는 것을 발견한 후, 심지어 절대적으로 SFW인 자세라도 이를 해결하려 했습니다. 예를 들면, 모델이 뒤로 기대며 팔로 몸을 지지하는 자세입니다. 트리거 단어는 "sitting"이고, 그 다음에 "leaning back, supporting herself with her arm"(또는 arms)을 사용합니다. 일관성을 높이기 위해 lora:LeaningBack-50:1 태그도 추가했습니다.

버전 2.0 세트에는 정면 각도의 이미지가 포함되어 있지만, 모델은 이 자세에서 가장 일반적인 측면 각도로 전환되는 경향이 있습니다. 다리 위치도 마찬가지입니다. "bent sit"이 가장 일반적이며, "half bent sit"과 "bent figure four"(한 다리는 구부리고 다른 다리는 그 아래로 교차)도 존재하지만, 프롬프트로는 접근할 수 없습니다. 어떤 에포크가 최적인지 결정하는 것이 어려웠습니다. 더 많은 에포크는 더 많은 제어를 제공하지만 부가적인 팔다리도 증가시킵니다. 항상 그렇듯이, 50에서 타협점을 찾았습니다. 저는 여전히 학습 중이며, 학습 단계와 필요한 이미지 수의 변동 범위가 크지만, 일부 다리 자세의 경우 10~15장의 이미지가 충분하지 않은 것 같습니다(이 세트는 총 57장입니다). 향후 문제는: LoRA를 더 세분화하여 다리 변형을 별도로 학습할 것인지, 또는 다른 다리 자세(및 카메라 각도 등)를 위한 별도의 LoRA를 생성할 것인지입니다. 이는 모듈식 시스템을 만드는 결과를 낳을 것입니다.


여기서 시작했으나 별도의 LoRA로 옮겨야 작동했던 것은 얼굴 각도, 몸의 각도, 카메라 각도 및 이미지 영역에 대한 더 세밀한 제어입니다. 하지만 이 LoRA를 시작으로, 캡션은 아직 독립적으로 작동하지는 않지만 준비 단계로 일관성을 확보했습니다. 구조는 다음과 같습니다:

얼굴 각도:
정면 시점 | 세-quarters 얼굴 시점 | 두-thirds 얼굴 시점 | 측면 시점

몸 각도:
정면 촬영 | 세-quarters 촬영 | 측면 촬영 | 세-quarters 뒷면 촬영

카메라 각도:
높은 카메라 각도 | 눈높이 촬영 | 낮은 카메라 각도 | 어깨 높이 촬영 | 카우보이 촬영 | 지면 수준 촬영

이미지 영역:
전신 초상 | 세-quarters 신체 초상 | 반신 초상 | 사분의 일 신체 초상

이것이 제대로 작동하게 되면 정말 좋겠습니다!


(버전 1.0용)
학습을 위해 크롭되지 않은 이미지를 사용해야 했기 때문에, 얼굴과 이미지의 다른 부분에 어느 정도 영향이 있습니다. "she is leaning back, supporting herself with her right arm" 또는 "she is laying on her left side, propping herself up on her left elbow"와 같은 프롬프트를 사용하면 작동합니다.

강도는 0.8에서 1.0 사이에서 효과가 있습니다. 손이나 발이 왜곡된다면 강도가 지나치게 높습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.