Destructive Kick - Wan I2V 14B

세부 정보

모델 설명

이 LoRA는 높은 킥 동작 영상용입니다. 심지어 물체를 파괴할 수 있습니다! 이 모델의 동작 복잡도는 제가 이전에 만든 다른 모델들보다 높기 때문에, 가끔 불안정할 수 있습니다. 하지만 보통 1~3번의 생성 과정 안에 좋은 결과를 얻습니다.

기반으로 I2V-14B-720P를 사용했습니다.

좋은 프롬프트:

  • 갈색 머리의 여자가 왼다리로 빠른 고키ック을 날리며 기둥과 싸우고, 기둥이 맞은 후 큰 조각들로 부서진다

  • 갈색 머리의 여자가 다리로 빠른 고키ック을 두 차례 연속으로 날리며 적과 싸우고, 검은 스타킹과 파란 하이힐을 신고 있다

학습 워크플로우:

저는 얼굴이 대부분 잘려 있는 남성과 여성의 8개 영상(각각 약 1초 길이)을 사용했습니다. 예를 들어, 발생하는 상황을 다음과 같이 기술했습니다:

다음은 일부 캡션입니다:

  • 검은 머리의 소녀가 오래된 창고에 있는 복싱 훈련장에서 오른다리로 검은 샌드백에 빠른 고키ック을 날리고, 샌드백이 충격을 흡수하며, 그녀는 흰색 핫팬츠와 팔 cuffs가 달린 흰색 스포츠 탑, 빨간 하이힐을 신고 있고, 얼굴은 잘려 있다

  • MMA 선수가 거리에서 오른다리로 돌멩이에 고키ック을 날리고, 돌멩이가 맞은 후 작은 조각들로 폭발한다. 그는 흰색 쇼츠와 검은 스포츠 재킷을 입고 있고, 얼굴은 잘려 있으며, 영상 품질이 나쁘다

그 후, Musubi-Tuner를 사용해 단일 이미지 및 전체 시퀀스 설정으로 약 64 에포크를 학습했습니다. 제 4090 GPU로 약 1시간 35분이 걸렸습니다.

이것이 전부입니다 :)

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.