Sex Motion Helper (prototype)
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
이 LoRA는 Hyvid의 이성 간 성적 장면에 더 많은 움직임과 디테일을 추가하도록 설계되었습니다. 단순한 자연어 프롬프트를 사용하여 다른 모션 LoRA와 함께 사용해야 합니다. 이 LoRA와 결합하는 다른 LoRA에 대한 프롬프트 지침을 참조하세요.
이 LoRA는 다음과 같은 방식으로 다른 성적 LoRA를 개선합니다:
- 캐릭터 LoRA와 결합할 때 더 많은 움직임을 제공합니다.
- 더 넓은 범위의 움직임과 얼굴 표정
- 더 나은 조명 및 배경
- 신체 및 해부학적 디테일의 향상
- 고해상도에서 더 선명한 출력 결과 - 흐릿함이 발생하면 다른 LoRA의 강도를 낮추세요
팁
점프하거나 갑작스러운 움직임이 발생하면 플로우 시프트를 높여보세요. 표준 값 9에서 17로 올리면 유동성이 향상되며, 특히 캐릭터 LoRA와 결합할 때 효과적입니다.
Boreal LoRA를 0.2~0.3의 강도로 추가하면 손, 발 및 기타 미세한 윤곽선이 개선됩니다.
이 LoRA를 사용하는 가장 간단한 방법은 이미 존재하는 생성 결과에 더 많은 움직임이나 디테일을 추가하고, 동일한 시드를 사용하여 이 LoRA의 강도를 0.2, 0.3 등으로 점진적으로 조절하며 최적의 강도를 찾는 것입니다. 필요한 강도는 다른 LoRA에 따라 달라지므로 약간의 실험이 필요합니다.
단독으로 사용할 경우, 가로 비율과 세로 비율에서 매우 다른 결과가 나옵니다. 학습 데이터는 모두 가로 비율이며 카메라 팬, 줌, 다양한 각도를 포함합니다. 가로 비율이 더 나은 결과를 생성하지만 프롬프트를 정확하게 구성하는 데 더 많은 노력을 필요로 합니다.
학습 노트
v0.1과 v0.2는 다양한 단편 PiV 클립으로 학습되었으나, 원본 해상도가 낮아 많은 아티팩트가 있었습니다.
v0.3에서는 4K 해상도, 각각 약 30분 길이의 5개의 영상으로 처음부터 다시 시작했습니다. diffusion-pipe를 사용하여 121프레임 @ 244px와 33프레임 @ 512px의 프레임 버킷을 생성했으며, overlapping_middle 방법을 적용해 모델이 전체 영상을 두 번 보게 하되 다른 샘플로 학습하도록 했습니다. 이는 고해상도로 단기 움직임을 학습시키고, 저해상도 샘플로 장기 움직임을 이해하도록 돕는 것이 목적입니다. 하나의 영상에서 여배우의 얼굴이 다른 영상보다 더 많이 등장했고, 그로 인해 그 여배우의 얼굴에 과적합되었습니다. 학습률은 5e-5이며 약 7,000스텝이 소요되었습니다.
v0.4는 v0.3 위에 8개의 새로운 영상(각각 약 1시간, 4K 소스)을 추가로 학습했습니다. 이번에는 1인칭 시점에 초점을 맞췄습니다. 다른 대부분의 성적 LoRA가 1인칭 시점이므로, 이를 결합했을 때 성능을 개선하고자 했습니다. 모든 소스는 16:9 비율이므로 가로 비율에서 더 나은 성능을 발휘합니다. 학습률을 1e-5로 낮춰 큰 기억 상실을 막았고, 총 스텝은 약 12,000스텝이었습니다. 현재까지 총 13개의 영상에서 약 19,000개의 개별 샘플을 학습했습니다.
중요한 점은, 이 모델은 어떠한 캡션도 포함하지 않아 텍스트 편향이 전혀 없습니다. 이는 Hunyuan의 사전 학습에 비디오 성적 콘텐츠가 포함되지 않았기 때문에(정지 영상은 가능하지만 움직임은 불가능한 이유) 그 공백을 채우는 데 목적이 있습니다.
이 LoRA 위에 한 번 더 세부 조정(항문 버전)을 수행하여 새로운 개념을 얼마나 빠르게 습득할 수 있는지 실험했습니다. 이 버전도 캡션 없이 하나의 영상으로 학습했으며, 영상 예제만으로도 개념을 잘 습득했습니다. 제 추측으로는, 소스의 다양성과 캡션을 더하면 세부 조정이 더욱 효과적일 것입니다.
버전 노트
V0.4
이 버전은 남성의 1인칭 시점 성적 장면을 학습하여, 남성 시점에서의 움직임과 성적 이해를 개선하는 것을 목표로 합니다. 이 모델은 3인칭 시점도 일부 이해하지만, 현재는 덜 발달되어 있습니다. 이 버전은 Missionary, Cowgirl, Reverse Cowgirl 등 1인칭 시점 LoRA와 함께 사용할 때 가장 우수한 성능을 발휘합니다.
가로 비율에서는 더 부드럽고 흥미로운 결과를 얻을 수 있습니다. 학습 데이터는 모두 16:9 비율의 4K 영상이므로, 이 비율을 사용하면 소스 자료에 더욱 가까워집니다. 세로 비율을 사용하면, 배치된 LoRA 중 세로 비율을 주로 사용하는 모델에 더 영향을 받게 됩니다.
이 버전은 이전에 너무 높은 학습률로 학습된 긴 영상으로 인해 얼굴 과적합의 문제가 여전히 존재합니다. 이 버전은 이 문제를 줄였지만 완전히 해소하려면 추가 학습이 필요합니다. 다음 버전은 얼굴 디테일, 표정, 다양성에 초점을 맞출 예정입니다.
갤러리 게시물에 몇 가지 예시 워크플로가 있습니다. 주요 전략은 기존 성적 LoRA를 일반 강도의 절반 수준으로 사용한 후, 이 LoRA를 0.5~1.5 강도로 결합하는 것입니다. 특히 이미지 기반 캐릭터 LoRA와 결합할 때는 약간의 실험이 필요합니다.
V0.3
이 버전은 이전 버전과 달리 고해상도 샘플과 더 다양한 장면으로 학습되었습니다. 현재는 마른 금발 여성에게 편향된 경향이 있으나, 프롬프트로 이를 조정할 수 있습니다.
이 버전도 단독으로 매우 잘 작동하며, 포즈를 정확히 얻기 위해 묘사적인 프롬프트를 사용하고 LoRA 강도 및 가이던스 수준을 조절해보세요. 이미지만으로 학습된 캐릭터 LoRA를 최대 1.3 강도까지 사용해도 움직임 손실 없이 훌륭한 결과를 얻었습니다.
vid2vid와도 매우 잘 어울리므로, 더 흥미로운 포즈를 원한다면 좋은 옵션입니다.
V0.3 - 항문 버전
이 버전은 단일 항문 영상으로 학습된 더욱 실험적인 버전입니다. 이는 기본 모델이 특정 학습을 통해 새로운 개념을 유도할 수 있음을 입증하는 데 목적이 있으며, 더 구체적인 변형의 가능성을 열어줍니다. Comfy에서 이를 재현하는 워크플로는 갤러리 영상에 포함되어 있습니다. 프롬프트 지침이 부족한 점 죄송합니다. 과거 워크플로를 재사용할 때 메타데이터 저장을 true로 설정하는 것을 잊고 있었기 때문입니다.
