Lying reclined

세부 정보

파일 다운로드

모델 설명

버전 2.0 업데이트:
이미지의 밝은 부분이나 어두운 부분에 가끔 보이는 격자 패턴이 OneTrainer를 사용한 fp4 학습과 관련이 있다는 것을 알게 된 후, fp8 학습으로 전환했습니다. 그 결과 패턴이 사라졌습니다. 하지만 모든 LoRA를 수정하려면 다시 전부 학습시켜야 합니다. 변경된 것은 단지 태그가 이제 lora:Reclined-step01260:1로 바뀐 것뿐입니다. 여전히 등에 평평히 누워서 팔꿈치나 등받이, 베개, 드리프트우드 등에 기대는 자세에 작동합니다. 등에 완전히 평평하게 누운 자세는 완전히 다른 데이터셋으로 만든 별도의 LoRA입니다.


Flux는 누워 있는 상태의 이미지를 생성하는 데 유명하게 약합니다. 제가 얻을 수 있었던 유일한 자세는 복부를 아래로 향해 누운 자세였고, 그때 발이 이상하게 나왔습니다. 처음에는 모든 자세를 하나의 LoRA로 통합하려 했지만, 많은 테스트 끝에 각 자세를 별도의 LoRA로 분리해야 했습니다. 예를 들어, 등에 완전히 평평하게 누운 자세와 기대어 누운 자세(reeclined position)를 구분하기가 어렵습니다. 만약 '앉아 있는'이라는 표현을 사용하면, 결과는 반드시 앉은 자세가 나오고, 기대어 누운 이미지가 평평하게 누운 이미지에 오염을 일으킵니다.

또한 lora:Reclined-80:1 태그를 사용해야 이미지에 영향을 줄 확률이 높아진다는 점도 알아냈습니다. 그렇지 않으면 이미지에 영향을 주는 것이 확률적인 수준입니다. 학습된 문장은 "reclined position에 있다"와 "그녀는 등에 누워 있으며, 팔꿈치나 다른 물체에 기대어 상체를 들어 올렸다."입니다. 기대는 행동은 팔꿈치나 등받이, 베개 등 다양한 물체를 사용할 수 있습니다. 다음 LoRA와의 차이점은 팔이 곧게 펴져 있지 않다는 점으로, 이는 상체를 더욱 높이 들어 올리고 앉은 자세를 만들게 되며, 이것이 'Leaning back' LoRA입니다. 이 LoRA는 학습 단계가 훨씬 적습니다. 왜냐하면 이 자세가 자연스럽게 더 잘 학습된 것처럼 보이기 때문입니다. 저는 'reclined'라는 문장의 부분을 충분히 테스트하지는 않았지만, "lying"이라는 단어를 사용할 때 더 안정적으로 작동하는 것 같습니다.


여기서 시작했지만 별도의 LoRA로 분리해야 작동하게 된 것은 얼굴 각도, 몸 각도, 카메라 각도 및 이미지 영역에 대한 더 미세한 제어입니다. 하지만 이 LoRA부터 시작해, 문장은 아직 독립적으로 작동하지는 않지만, 준비 단계로서 일관성을 유지합니다. 구조는 다음과 같습니다:

얼굴 각도:
정면 시점 | 세quarter 얼굴 시점 | 두third 얼굴 시점 | 측면 시점

몸 각도:
정면 각도 | 세quarter 각도 | 측면 각도 | 세quarter 뒷면 각도

카메라 각도:
높은 카메라 각도 | 눈 높이 시점 | 낮은 카메라 각도 | 어깨 높이 시점 | 카우보이 샷 | 지면 수준 시점

이미지 영역:
전신 초상화 | 세quarter 신 초상화 | 반신 초상화 | 사분의 일 신 초상화

이 모든 것을 제대로 작동시키면 좋겠습니다!

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.