Feet Up

세부 정보

파일 다운로드

모델 설명

버전 2.0 업데이트:

만족하지는 않지만, 최소한 버전 1.0보다는 나아졌습니다. 이 LoRA는 신발이나 스타킹이 있는 71장의 이미지와 벌거벗은 발이 있는 43장의 이미지로 구성된 데이터셋에서 생성되었습니다. 하이힐이 다른 신발보다 더 잘 작동하며, 벌거벗은 발도 괜찮습니다. 완벽하지는 않지만, 네 장의 이미지 중 한 두 장은 괜찮은 수준으로 생성됩니다. 저는 이 것이 제 하드웨어와 사용 가능한 이미지로 만들 수 있는 최대한의 결과라고 생각하며, 여러 가지 다른 접근 방식을 시도했습니다. 만약 추측해 본다면, 이 모델이 안정적으로 작동하려면 수백 장의 추가 이미지와 약 100 에포크가 필요할 것 같습니다. 그러나 이것은 제 능력 범위를 넘어섭니다.


이 LoRA는 해결하기 어려운 문제였습니다. 저는 사람이 배를 대고 누워서 발을 하늘로 뻗은 이미지를 생성하려고 시도했습니다. 그런데 Flux는 발에 대해 전혀 알지 못하는 것처럼 보였습니다. 벌거벗은 발은 그리 나쁘지 않았지만, 신발은 전혀 다른 문제였습니다.

여러 샘플 세트와 접근 방식을 시도했습니다. 심지어는 93장의 이미지와 300 에포크로 rank 32를 사용하기도 했습니다. 4060Ti에서 2.54 이미지/초 속도로, 얼마나 긴 시간이 걸렸는지 계산해 보세요. 게다가 더 나쁜 점은, 심지어 그것이 잘 작동하더라도 이미지가 흐려졌다는 것이었습니다. 저는 LoRA가 얼굴에 영향을 미치지 않도록 오래전부터 이미지를 하체와 발만 영역으로 잘라서 사용했습니다. 마지막 시도는 rank 4와 100 에포크였는데, 이 방식이 훨씬 더 잘 작동했습니다.

이것을 개발하고 테스트하는 동안, 저는 아마도 살아있는 성형외과의보다 더 많이 변형된 발을 봤을 것입니다. 그럼에도 불구하고, 이 LoRA는 겨우 작동할 뿐입니다. 신발에는 약 0.9의 강도가 필요하고, 벌거벗은 발에는 훨씬 낮은, 대략 0.5 정도가 필요합니다. 불행히도, 어떤 방향으로 잘못되었는지 판단하기가 어렵습니다. 다리나 발, 또는 발바닥이 이상한 위치에 너무 많이 나타나면, 강도를 낮추세요. 신발이 너무 크면 역시 강도를 낮추고, 변형된 신발은 강도가 너무 낮다는 뜻입니다.
저는 "발을 위로" "다리를 위로" "발바닥이 보임"이라는 텍스트로 학습을 진행했습니다. 왜냐하면 발바닥에 대한 데이터가 부족한 것이 문제의 일부인 것처럼 보였기 때문입니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.