Freedive girls, underwater style
세부 정보
파일 다운로드
모델 설명
2025년 8월 업데이트:
FLUX 버전과 동일한 데이터셋에 85개의 동영상을 추가하여 Wan2.1 LoRA를 업로드했습니다.
4개의 GPU로 4일 동안 학습했으며 비용이 꽤 들었지만 결과는 매우 좋습니다.
샘플 생성에 사용된 프롬프트를 확인하여 어떤 키워드를 사용할 수 있는지 확인하세요.
2025년 3월 업데이트:
FLUX 버전을 만들었지만, 결과가 일관되지 않아 사용을 권장하지 않습니다.
물론 누구나 시도해보고 최적의 설정을 찾아볼 수 있습니다.
1000장의 이미지 데이터셋은 CivitAI에서 제공하는 10,000 스텝의 한계까지 학습되었지만, 이는 충분하지 않다고 생각합니다. 개별 개념(예: 다이빙 핀)을 학습하여 병합하거나, 다른 서비스를 통해 최소 50,000 스텝까지 학습할 방법을 찾아야 할 것입니다.
v02 업데이트:
데이터셋을 1000장의 이미지로 확장했습니다. 현재 진행 중입니다.
여성 프리다이버 약 450명의 이미지를 기반으로 학습했으며, 시도한 모든 체크포인트가 다양하고 우수한 수중 이미지를 생성하는 데 어려움을 겪었는데, 이 LoRA는 그 문제를 크게 개선해줍니다.
사용 시 참고 사항:
가장 중요한 것은 LoRA를 활성화하기 위해 "underwater" 태그를 사용하는 것입니다.
몇 가지 트리거 단어를 사용할 수 있습니다. 예를 들어, "dive mask coco", "dive mask cressif1" 또는 "dive mask oval mask"를 입력하면 세 가지 특정 유형의 다이빙 마스크를 생성할 수 있으며, 이들은 SDXL(및 제가 시도한 모든 확산 모델)에서 일반적으로 나쁜 결과를 내는 다이빙 마스크를 매우 잘 표현합니다. "dive mask reflection"을 추가하면 마스크 유리에 햇빛이나 주변 환경이 반사됩니다.
"floating hair"와 "flowing hair"는 머리카락에 영향을 미칩니다. "floating hair"는 정지 자세에 더 적합하고, "flowing hair"는 수영 자세에 더 적합합니다.
이 LoRA는 약간의 시도와 오류를 통해 비교적 정확한 다이빙 핀을 생성할 수 있습니다. "diving fins" 또는 "freedive fins"를 사용하세요. "weight belt"를 추가하면 그대로 적용되지만, 학습 데이터가 부족해 매우 우수한 렌더링 결과는 얻기 어렵습니다. 핀을 원하지 않는 경우에는 "barefoot"를 사용하세요. 다이빙 핀은 스타일과 형태가 매우 다양하여 학습하기 어렵습니다. 일관된 결과를 원하신다면 특정 모델용 LoRA를 제작했습니다: /model/765372/diving-fins-white-and-pink-finsovwp1
수중 가시성을 나타내는 태그를 추가했습니다. "excellent water visibility", "good water visibility", "regular water visibility", "poor water visibility"는 각각 효과를 줍니다. "murky water"와 "dark water"도 강력한 효과를 줍니다. "water surface"는 수면 아래를 보여주고, "surface reflections"는 피사체를 수면 근처에 두고 위쪽 수면에 반사되게 합니다. "caustics", "light rays", "sunlight"는 빛 효과를 추가합니다.
바닥 관련 파라미터도 여러 가지 있습니다. "sandy bottom", "coral rubble", "coral reef", "rocks", "cave" 등이며, "shipwreck"을 사용하면 이미지에 정확히 선박 잔해가 추가됩니다.
"ocean"과 "swimming pool"을 전환할 수 있으며, "split shot"을 시도해보면 이미지가 수중과 수면 위로 나뉘어 표현됩니다.
자세를 조정하려면 "facing up/down/away/towards viewer"로 신체 방향을, "looking towards viewer/up/down/aside"로 머리 방향을 제어할 수 있으며, "swimming up/down/towards viewer/away" 및 "selfie"도 효과를 줍니다. "from above/side/below/behind"는 카메라 각도에 잘 작동합니다.
수영복의 경우 "bikini"와 "one-piece swimsuit" 외에도 "wetsuit"와 "french cut wetsuit"(다리가 드러난 스웨트슈트)를 사용할 수 있으며, 색상과 "long/short sleeves", "barelegs"를 조합해 수정할 수 있습니다.
이 LoRA의 주요 목적 중 하나는 확산 모델에서 나타나는 '스노클링 셀카 증후군'을 극복하는 것입니다. 즉, 모델들이 대부분 스노클링 중 셀카 사진으로만 학습되어 "1girl underwater"와 같은 프롬프트를 입력하면 거의 항상 표면에 떠있는 여성의 얼굴 근처 클로즈업 이미지를 생성한다는 것입니다. 저는 이 문제를 과도하게 해결하려 했기 때문에, 이 LoRA는 전신, 원근이 넓은 이미지를 주로 생성합니다. 따라서 클로즈업을 원하신다면 이를 강조해야 합니다.
마지막으로, 이 LoRA는 몇 주간의 작업과 많은 Buzz를 투입하여 학습되었습니다. 따라서 탭 옵션을 사용해 주시거나 이미지를 모델에 직접 게시해 주신다면 감사하겠습니다. 이 LoRA용 PONY 버전을 만들어보았지만 실패했고, 이 실패로 약 4000 Buzz를 소모했기 때문에 더 이상 시도하지 않았습니다.




















