Sex Motion Helper (prototype)

세부 정보

파일 다운로드

모델 설명

이 LoRA는 Hyvid의 이성 간 성적 장면에 더 많은 움직임과 디테일을 추가하도록 설계되었습니다. 단순한 자연어 프롬프트를 사용하여 다른 모션 LoRA와 함께 사용해야 합니다. 이 LoRA와 결합하는 다른 LoRA에 대한 프롬프트 지침을 참조하세요.

이 LoRA는 다음과 같은 방식으로 다른 성적 LoRA를 개선합니다:

  • 캐릭터 LoRA와 결합할 때 더 많은 움직임을 제공합니다.
  • 더 넓은 범위의 움직임과 얼굴 표정
  • 더 나은 조명 및 배경
  • 신체 및 해부학적 디테일의 향상
  • 고해상도에서 더 선명한 출력 결과 - 흐릿함이 발생하면 다른 LoRA의 강도를 낮추세요

  • 점프하거나 갑작스러운 움직임이 발생하면 플로우 시프트를 높여보세요. 표준 값 9에서 17로 올리면 유동성이 향상되며, 특히 캐릭터 LoRA와 결합할 때 효과적입니다.

  • Boreal LoRA를 0.2~0.3의 강도로 추가하면 손, 발 및 기타 미세한 윤곽선이 개선됩니다.

  • 이 LoRA를 사용하는 가장 간단한 방법은 이미 존재하는 생성 결과에 더 많은 움직임이나 디테일을 추가하고, 동일한 시드를 사용하여 이 LoRA의 강도를 0.2, 0.3 등으로 점진적으로 조절하며 최적의 강도를 찾는 것입니다. 필요한 강도는 다른 LoRA에 따라 달라지므로 약간의 실험이 필요합니다.

  • 단독으로 사용할 경우, 가로 비율과 세로 비율에서 매우 다른 결과가 나옵니다. 학습 데이터는 모두 가로 비율이며 카메라 팬, 줌, 다양한 각도를 포함합니다. 가로 비율이 더 나은 결과를 생성하지만 프롬프트를 정확하게 구성하는 데 더 많은 노력을 필요로 합니다.

학습 노트

v0.1과 v0.2는 다양한 단편 PiV 클립으로 학습되었으나, 원본 해상도가 낮아 많은 아티팩트가 있었습니다.

v0.3에서는 4K 해상도, 각각 약 30분 길이의 5개의 영상으로 처음부터 다시 시작했습니다. diffusion-pipe를 사용하여 121프레임 @ 244px와 33프레임 @ 512px의 프레임 버킷을 생성했으며, overlapping_middle 방법을 적용해 모델이 전체 영상을 두 번 보게 하되 다른 샘플로 학습하도록 했습니다. 이는 고해상도로 단기 움직임을 학습시키고, 저해상도 샘플로 장기 움직임을 이해하도록 돕는 것이 목적입니다. 하나의 영상에서 여배우의 얼굴이 다른 영상보다 더 많이 등장했고, 그로 인해 그 여배우의 얼굴에 과적합되었습니다. 학습률은 5e-5이며 약 7,000스텝이 소요되었습니다.

v0.4는 v0.3 위에 8개의 새로운 영상(각각 약 1시간, 4K 소스)을 추가로 학습했습니다. 이번에는 1인칭 시점에 초점을 맞췄습니다. 다른 대부분의 성적 LoRA가 1인칭 시점이므로, 이를 결합했을 때 성능을 개선하고자 했습니다. 모든 소스는 16:9 비율이므로 가로 비율에서 더 나은 성능을 발휘합니다. 학습률을 1e-5로 낮춰 큰 기억 상실을 막았고, 총 스텝은 약 12,000스텝이었습니다. 현재까지 총 13개의 영상에서 약 19,000개의 개별 샘플을 학습했습니다.

중요한 점은, 이 모델은 어떠한 캡션도 포함하지 않아 텍스트 편향이 전혀 없습니다. 이는 Hunyuan의 사전 학습에 비디오 성적 콘텐츠가 포함되지 않았기 때문에(정지 영상은 가능하지만 움직임은 불가능한 이유) 그 공백을 채우는 데 목적이 있습니다.

이 LoRA 위에 한 번 더 세부 조정(항문 버전)을 수행하여 새로운 개념을 얼마나 빠르게 습득할 수 있는지 실험했습니다. 이 버전도 캡션 없이 하나의 영상으로 학습했으며, 영상 예제만으로도 개념을 잘 습득했습니다. 제 추측으로는, 소스의 다양성과 캡션을 더하면 세부 조정이 더욱 효과적일 것입니다.

버전 노트

V0.4

이 버전은 남성의 1인칭 시점 성적 장면을 학습하여, 남성 시점에서의 움직임과 성적 이해를 개선하는 것을 목표로 합니다. 이 모델은 3인칭 시점도 일부 이해하지만, 현재는 덜 발달되어 있습니다. 이 버전은 Missionary, Cowgirl, Reverse Cowgirl 등 1인칭 시점 LoRA와 함께 사용할 때 가장 우수한 성능을 발휘합니다.

가로 비율에서는 더 부드럽고 흥미로운 결과를 얻을 수 있습니다. 학습 데이터는 모두 16:9 비율의 4K 영상이므로, 이 비율을 사용하면 소스 자료에 더욱 가까워집니다. 세로 비율을 사용하면, 배치된 LoRA 중 세로 비율을 주로 사용하는 모델에 더 영향을 받게 됩니다.

이 버전은 이전에 너무 높은 학습률로 학습된 긴 영상으로 인해 얼굴 과적합의 문제가 여전히 존재합니다. 이 버전은 이 문제를 줄였지만 완전히 해소하려면 추가 학습이 필요합니다. 다음 버전은 얼굴 디테일, 표정, 다양성에 초점을 맞출 예정입니다.

갤러리 게시물에 몇 가지 예시 워크플로가 있습니다. 주요 전략은 기존 성적 LoRA를 일반 강도의 절반 수준으로 사용한 후, 이 LoRA를 0.5~1.5 강도로 결합하는 것입니다. 특히 이미지 기반 캐릭터 LoRA와 결합할 때는 약간의 실험이 필요합니다.

V0.3

이 버전은 이전 버전과 달리 고해상도 샘플과 더 다양한 장면으로 학습되었습니다. 현재는 마른 금발 여성에게 편향된 경향이 있으나, 프롬프트로 이를 조정할 수 있습니다.

이 버전도 단독으로 매우 잘 작동하며, 포즈를 정확히 얻기 위해 묘사적인 프롬프트를 사용하고 LoRA 강도 및 가이던스 수준을 조절해보세요. 이미지만으로 학습된 캐릭터 LoRA를 최대 1.3 강도까지 사용해도 움직임 손실 없이 훌륭한 결과를 얻었습니다.

vid2vid와도 매우 잘 어울리므로, 더 흥미로운 포즈를 원한다면 좋은 옵션입니다.

V0.3 - 항문 버전

이 버전은 단일 항문 영상으로 학습된 더욱 실험적인 버전입니다. 이는 기본 모델이 특정 학습을 통해 새로운 개념을 유도할 수 있음을 입증하는 데 목적이 있으며, 더 구체적인 변형의 가능성을 열어줍니다. Comfy에서 이를 재현하는 워크플로는 갤러리 영상에 포함되어 있습니다. 프롬프트 지침이 부족한 점 죄송합니다. 과거 워크플로를 재사용할 때 메타데이터 저장을 true로 설정하는 것을 잊고 있었기 때문입니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.