HunyuanVideo - Ginny Ishuzoku Reviewers
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
WIP - 시도해보고 결과를 공유해 주세요. 사람들이 어떤 결과를 만들어낼지 궁금합니다.
추후 업데이트 예정입니다. 관심이 있다면 저에게 피드백을 보내주세요.
이 LoRA는 _Ishuzoku Reviewers_에서 영감을 받은 캐릭터 Ginny를 사실적으로 생성하도록 설계되었습니다. 소의 뿔과 거대한 가슴을 특징으로 합니다. 이 모델은 HunyuanVideo의 비디오-비디오(V2V) 및 이미지-비디오(I2V) 워크플로우 모두와 호환됩니다. 이 모델은 PonyXL과 Ginny Pony LoRA를 사용하여 1024 x 1440 해상도로 생성된 Ginny의 1092장의 사실적인 이미지로 학습되었습니다. 학습이 부족한 상태지만, 요청이 있어 진행 중인 상태로 공개합니다.
Bouncing Breasts HunyuanVideo LoRA와 호환됩니다. 하지만 이미지 품질이 상당히 떨어질 수 있으며, 제 LoRA가 학습이 부족하기 때문에 오히려 이 LoRA에 의해 지배될 수 있습니다.
""\_(:3)_/""
Kling은 필요 없습니다.
사용 방법:
선호하는 Hunyuan 워크플로우(V2V 또는 I2V)에 LoRA를 로드하세요. (저의 이전 게시물 중 일부에 워크플로우가 포함되어 있습니다.)
큰 가슴을 가진 여성의 짧은 클립을 로드하세요. 특히 많은 상하 진동이 있는 클립이 이상적입니다. 제가 사용한 해상도는 800 x 1120입니다.
트리거 프롬프트를 사용하세요:
"Ginny, a woman with cow horns and huge breasts".장면 설명을 추가하고 필요한 경우 CFG 설정을 조정하세요.
예시 프롬프트 스타일:
"Ginny, a woman with cow horns and huge breasts, leaning forward as her breasts sway gently the cinematic lighting highlights the motion of her breasts" 같은 식으로 작성하세요... 248 토큰 이내로 유지해 주세요.
대부분의 생성은 800 x 1120 해상도, 97 프레임, CFG 1, 25 스텝으로 이루어집니다. 24GB VRAM 카드를 사용하면 129 프레임까지 늘릴 수 있지만, 메모리 절약을 위해 Double Block swap 20과 Single Block 40을 교체해야 합니다. 각 생성은 약 45분 소요됩니다.
빠른 실행: 스텝 10-15, CFG 1, 49 프레임. 약 7분 소요됩니다. 추론 스텝이 많을수록 모델은 프롬프트 내 단어 간 상호작용에 따라 비디오의 시각적 특징에 더 집중하며, 이는 의미적 이해에 영향을 미칩니다. 이는 더 나은 품질과 더 많은 움직임을 가져올 것으로 예상되나, 메모리 사용량이 증가합니다.
CFG 설정:
- CFG Scale: 1
- 이 범위의 CFG 값은 애니메이션 품질과 일관성을 크게 향상시킵니다. 더 높은 값은 상당한 VRAM을 요구하며, 모델을 과도히 제한해 딱딱하거나 자연스럽지 않은 움직임을 유발할 수 있습니다. 544 x 720 같은 작은 해상도를 생성할 때는 CFG 2와 49 프레임을 시도해 보세요.
네거티브 프롬프트:
low quality, bad hands, bad teeth, bad eyes, bad limbs, distortion, talking, speaking
학습 통찰
데이터셋 크기 및 품질
소규모 데이터셋 (<100장 이미지):
결과는 그럭저럭 좋았으나, 가슴의 물리적 움직임과 전반적인 사실성에서 일관성이 부족했습니다. 프롬프트 스타일은 다양했지만, 모델은 일반화에 어려움을 겪었습니다.
대규모 데이터셋 (~1000장 이미지):
지금까지 가장 나은 결과는 다양한 데이터셋에 세부적인 프롬프트를 교차하여 적용한 경우였습니다.
대규모 데이터셋의 다양성은 모델이 더 나은 동작 역학과 해부학적 세부사항을 학습하는 데 도움이 되었던 것으로 보입니다.
특히 큰 가슴의 진동을 자연스럽게 구현하는 것은 어렵습니다. 모델은 종종 움직임을 과장하거나 부족하게 표현합니다.
가능한 해결책은 큰 가슴의 진동 영상을 활용해 사전 학습을 진행하는 것입니다. 현재 이 방식으로 사전 학습을 시도 중이며, 모델에 현실적인 물리학을 가르치고자 합니다.
소규모 데이터셋 통합: 사전 학습 후, Ginny 전용 이미지로 구성된 소규모 및 정제된 데이터셋으로 미세 조정할 계획입니다.
결과 대기 중: 이 방식의 성과에 따라 데이터셋을 추가로 확장할 수 있습니다.
다음 단계
영상 사전 학습: 가슴 물리학과 자연스러운 움직임에 집중합니다.
미세 조정: Ginny 전용 고화질 이미지의 소규모 데이터셋을 통합합니다.
이것은 진행 중인 작업입니다. 여러분의 피드백을 매우 기다립니다! LoRA를 테스트하고 결과를 공유해 주세요. 무엇이 잘 작동하나요? 무엇이 잘 안 되나요? 가슴 물리학을 더 나은 방식으로 구현하는 방법이 있다면 알려주세요.
추후 업데이트 예정입니다.
