Wan2.1 SkyReelsV2 VACE 14B T2V I2V Extend & Loop

세부 정보

파일 다운로드

모델 설명

Wan2.1 SkyReelsV2 VACE 워크플로우, MoviiGen AccVid CausVid FusionX LoRAs(14B T2V, Reference I2V, Extend & Loop)로 테스트됨

이 ComfyUI 워크플로우는 다음을 지원합니다:

  • SkyReels-V2-VACE-GGUF를 사용한 이미지에서 비디오로(I2V)반복 가능한 비디오 확장(V2V) 생성

  • AccVidCausVid LoRAs에 2개의 샘플러를 사용하여 더 빠른 생성

  • MoviiGenReward LoRAs를 사용하여 더 나은 성능

다음을 수행할 수 있습니다:

  • 시작점으로 첫 번째 비디오 생성

  • 한 번에 하나씩 비디오를 확장하여 전체 시퀀스를 점진적으로 구성

  • 최종 편집용으로 최고의 장면을 선택하여 사용

  • 장면이나 동작이 진화함에 따라 프롬프트를 단계적으로 개선


🔧 구성 요소

🌀 SkyReels-V2-VACE-GGUF (제작: wsbagnsv1)

  • Wan2.1 기반, 720p@24fps 비디오로 미세 조정됨

  • 통합된 **VACE(모든 비디오 생성 및 편집 프레임워크)**는 참조 비디오를 사용하여 움직임 제어 가능 (비디오용 ControlNet과 유사)

  • GGUF 포맷을 통해 ComfyUI에서 원활히 지원

  • 전체 시퀀스에 걸쳐 시간적 일관성 보장


LoRA 모델

속도

품질

통합형


▶️ 사용 방법


🖼️ 첫 번째 프레임으로 이미지에서 비디오 생성

  1. 무음 노드에서 "First Frame" 활성화

  2. 입력 이미지 업로드

  3. 생성 파라미터 설정:

    • 프롬프트(긍정/부정)

    • Shift

    • Steps

    • Seed

    • 너비/높이

    • 길이(프레임 수)

    • 샘플러

    • 스케줄러

  4. Run 클릭


🎥 기존 비디오를 확장하거나 반복

  1. "Video Extension" 또는 "Video Loop" 옵션 활성화

  2. 입력 비디오 업로드 또는 선택 (최적의 품질을 위해 Load Image 노드를 사용하여 애니메이션 WebP 형식으로)

  3. 확장 파라미터 설정:

    • 오버랩 프레임 수

    • 확장 프레임 수

    • 프롬프트(긍정/부정)

    • Shift

    • Steps

    • Seed

    • 샘플러

    • 스케줄러

  4. Run 클릭

지속 프레임 수 (필요에 따라 조정)

  • 오버랩 프레임: 원래 애니메이션에서 이어받는 프레임 수

    • 높은 값은 시간적 일관성을 높이고 이전 구간의 흐름을 보존

    • 낮은 값은 전환의 갑작스러움 또는 움직임, 속도, 방향의 급격한 변화를 초래할 수 있음

  • 확장 프레임: 현재 애니메이션 이후에 생성할 새로운 프레임 수


⚠️ 도전 과제 및 제한 사항

기반 모델은 T2V 모델이며, 진정한 I2V 모델은 아닙니다.

I2V는 VACE 노드에 참조 이미지를 입력하여 구현되며, 이미지를 직접 보존하는 방식이 아닙니다.

I2V 모델은 일반적으로 입력 이미지를 정확한 첫 번째 프레임으로 유지합니다.

여기서는 VACE가 이미지를 느슨한 가이드로만 취급하며, 시각적 정확한 보존은 하지 않습니다.

예시:

  • 소스 이미지에 객체가 없으나 프롬프트에 포함된 경우, 그 객체가 첫 번째 프레임에 추가될 수 있음

  • 프롬프트가 이미지와 모순될 경우, 일부 원래 요소가 사라질 수 있음

  • 세부 사항은 시간이 지남에 따라 저하될 수 있으며, 특히 확장된 비디오 생성 시 더욱 두드러짐


📂 참고 자료


FAQ (자주 묻는 질문)

❓ 16GB VRAM으로 실행할 수 있나요?

네. 저는 Q6_K GGUF 모델을 사용하여 RTX 5060 Ti(16GB VRAM)에서 실행했습니다.

GGUF 모델을 사용하면 GPU 메모리에 맞춰 버전을 선택할 수 있습니다:

  • ~8GB VRAM용: Q3_X_X (3비트)

  • ~12GB VRAM용: Q4_X_X (4비트)

  • ~16GB VRAM용: Q5–Q6

  • ~24GB 이상 VRAM용: Q8

👉 모델 및 하드웨어 정보: https://huggingface.co/QuantStack/SkyReels-V2-T2V-14B-720P-VACE-GGUF

❓ 왜 오류나 나쁜 비디오 클립이 나오나요?

이 워크플로우는 여전히 실험적이며, 충돌이나 나쁜 결과가 흔합니다. 다음 팁을 참고하세요:

  • OOM(메모리 부족) 오류 = GPU의 VRAM이 충분하지 않음

  • 메모리 사용량을 줄이기 위해 낮은 양자화 모델(예: Q3 또는 Q4) 사용

  • 비디오 해상도나 클립 길이를 줄여 과부하 방지

  • 전환 결과가 좋지 않다면, 프롬프트나 다른 설정을 조정해 보세요

  • 여러 번 생성한 후, 가장 좋은 클립을 선택해 결합

❓ 특정 해상도에서 왜 오류가 발생하나요?

"WanVaceToVideo" 노드너비와 높이가 모두 16으로 나누어 떨어지는 해상도만 허용합니다. 입력 해상도가 이 요구사항을 충족하지 않으면 오류나 처리 실패가 발생할 수 있습니다.

다음은 표준 출력 높이(320, 368, 480, 544, 640, 720)를 기준으로 한 추천 해상도입니다:

권장 비율 및 해상도 (모두 16으로 나누어 떨어짐)

  • 🖥 32:9 -> 1136x320

  • 📽 21:9 -> 752x320, 864×368, 1120×480, 1264×544

  • 🖼 2:1 -> 640x320, 736×368, 960×480, 1088×544, 1280×640

  • 📺 16:9 -> 576x320, 656×368, 832×480, 960×544, 1136×640, 1280×720

  • 🖥 16:10 -> 512x320, 592×368, 768×480, 864×544, 1024×640, 1152×720

  • 📷 3:2 -> 480x320, 560×368, 720×480, 816×544, 960×640, 1088×720

  • 🖼 4:3 -> 432x320, 496×368, 640×480, 720×544, 848×640, 960×720

  • 🖼 5:4 -> 400x320, 464×368, 608×480, 688×544, 800×640, 896×720

❓ 이미지를 업로드할 때 "Request Entity Too Large" 오류가 발생하면 어떻게 해야 하나요?

이 오류는 일반적으로 파일 크기가 업로드 한계를 초과할 때 발생합니다. 해결 방법:

  1. WebP 파일을 ComfyUI\input 폴더에 직접 복사

  2. ComfyUI에서 Reload(R) 버튼을 눌러 파일 목록을 새로 고침

  3. “파일 업로드 선택” 대신 Load Image 노드를 사용하여 파일 선택

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.