BBC Ride Wan (2.2!)

세부 정보

모델 설명

Wan 2.2!

Wan 2.2에서 데이터셋을 재학습했습니다. 반드시 두 개의 LoRA(고해상도 및 저해상도)를 모두 다운로드하세요!
K3NK의 워크플로우로 훌륭한 결과를 얻고 있습니다 - /model/1824027/wan-22-t2v-i2v4-stepskijais-wrapper-workflowk3nk

업데이트 6.17

이 LoRA를 개선하려다 보니 T2V 버전을 업로드한 적이 없었다는 것을 깨달았습니다. 그래서 여기 있습니다. 즐겁게 사용하세요!

-- -- --

두 번째 LoRA입니다... 캡션 작성 방식에 큰 변화를 주었고, 그 결과 향상된 효과를 확인할 수 있습니다.

이 LoRA로 만든 작품을 꼭 공유해주세요! 더 나은 프롬프트를 보고 싶습니다!

이 LoRA는 WAN 14B I2V 모델을 기반으로, diffusion-pipe를 사용해 480P/24FPS로 정규화하고 3초로 자른 45개의 영상으로 학습되었습니다. 그러나 T2V 모델에서도 괜찮은 성능을 보이며, 그에 대한 일부 예시도 포함했습니다.

저의 캡션 작성 방식:

  1. 45개의 영상을 480P, 3초, 24FPS로 리사이즈했습니다.

  2. 각 영상에 ComfyUI_Qwen2-VL-Instruct를 적용해 기본 영상 설명을 생성했습니다. 하지만 이 방법은 NSFW 요소를 인식하지 못했습니다. LLM이 거의 "역겨워하는" 듯한 반응을 보여 같은 이미지로 몇 번 시도해야 했습니다. :D

  3. 제가 가장 선호하는 프레임을 골라 Joy Caption 2를 통해 캡션을 생성한 후, Qwen 설명과 Joy Caption Two 캡션을 수동으로 결합하여 최종 .txt 파일을 완성했습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.