Wan 2.2 I2V: HD/FHD resolution, but much faster

세부 정보

파일 다운로드

모델 설명

이 워크플로우는 "속도 대 품질"의 딜레마를 크게 완화하여, 저사양 하드웨어를 가진 사용자라도 HD 해상도로 영상을 거의 2배 빠르게 생성할 수 있습니다!

작동 원리

원리는 매우 단순합니다: 고노이즈 모델을 매우 낮은 해상도에서 실행한 후, 잠재 변수를 업스케일링하여 저노이즈 샘플러에 주입합니다.

원본 이미지도 다시 주입되며, 저노이즈 샘플링 단계에서 새로운 Wan 워래퍼 노드를 사용하여 시각적 디테일이 보존됩니다.

한계점

  • 움직임이 약간 세밀함을 잃지만, 대부분의 경우 속도 향상이 이를 충분히 상쇄합니다.

  • T2V에서는 테스트되지 않았으며, 아마도 작동하지 않을 것입니다.

시작하기

  1. 모델을 본인의 모델로 교체하거나, 아래 링크를 따라 다운로드하세요.

  2. 설치된 시스템에 아래 커스텀 노드가 없으면 설치하세요.

  3. 이미지를 불러오고 프롬프트를 입력하세요.

  4. 실행을 클릭하세요.

커스텀 노드

필수

옵션

·         ComfyUI-GIMM-VFI (보간용)

사용된 모델

Wan 2.2 14B I2V, 양자화:

Lightx2v LoRA:

Fun LoRA:

속도 벤치마크

  • 설정: 65프레임, Q5_K_M I2V 모델 사용, 고노이즈 단계에서 lightx2v 1030으로 4스텝, 저노이즈 단계에서 lightx2v 1022 및 Fun HPS2.1 LoRA로 4스텝, 두 샘플러 모두에 euler/beta 샘플러/스케줄러 사용.

  • 하드웨어: VRAM 12GB, RAM 32GB를 갖춘 RTX 3060.

768*1152px (2:3)

  • 768*1152, 업스케일 안 함: 20′46″

  • 256*384 → x2 → x1.5: 11′16″ (-46%)

  • 256*384 → x1.5 → x2: 10′48″ (-48%)

720*1280px (9:16)

  • 720*1280, 업스케일 안 함: 23′19″

  • 288*512 → x2.5: 15′57″ (-32%)

  • 288*512 → x2 → x1.25: 11′57″ (-49%) <- 이 영상이 표시된 영상입니다

목표 해상도와 하드웨어 요구사항

  • HD: VRAM 12GB 이상

  • FHD: VRAM 16GB 이상? (테스트되지 않음, 피드백 환영)

워크플로우에는 초기 샘플링 해상도 및 스텝 설정 권장값이 포함되어 있습니다.

수정: 마지막 샘플러의 스케줄러는 기본적으로 _linear_quadratic_로 설정되어 있으나, _beta_로 설정해야 합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.