WAN VACE Professional Video-to-Video Complete Workflow

세부 정보

파일 다운로드

모델 설명

🎬 WAN VACE를 사용한 전문적인 비디오에서 비디오로의 변환

이 통합 ComfyUI 워크플로우를 사용하여 WAN VACE로 전문 수준의 화질로 비디오를 변환하세요. 이 전체 파이프라인은 장편 비디오의 원활한 비디오-비디오 변환을 가능하게 하며, 원활한 연결, 업스케일링 및 프레임 보간 같은 고급 기능을 포함합니다. 긴 비디오를 관리 가능한 세그먼트로 분할하고 개별적으로 처리한 후, 일관되고 고품질의 출력물로 원활하게 결합하세요.

✨ 핵심 기능

  • 장비디오 처리: 세그먼트로 분할하여 원활하게 재결합하여 긴 비디오 콘텐츠 처리

  • 완전한 V2V 파이프라인: 비디오-비디오 변환을 위한 전체 워크플로우

  • 원활한 비디오 결합: 보이지 않는 전환을 위한 전문적인 비디오 연결 전용 커스텀 노드

  • 다단계 프로세스: 생성 → 결합 → 통합 → 업스케일 → 보간

  • 전문 품질: 사용자 정의 설정으로 고품질 출력

  • 메모리 최적화: 다양한 GPU 구성에 맞는 저 VRAM 옵션

  • 배치 처리: 여러 비디오 세그먼트를 효율적으로 처리

  • 확장 가능한 아키텍처: 지능형 세그먼트화로 어떤 길이의 비디오라도 처리 가능

📋 요구사항

필수 모델 파일

🔴 WAN GGUF 모델

🟣 WAN VAE

🟣 WAN 텍스트 인코더

필수 커스텀 노드

⚠️ 중요: 이 페이지에서 다음 커스텀 노드를 다운로드하세요(ComfyUI-Manager에서는 사용 불가):

  • seamless_join_video_clips.py

  • combine_video_clips.py

  • 위치: ComfyUI/custom_nodes/

ComfyUI 확장

⚙️ ComfyUI-Manager를 사용하여 다음 커스텀 노드를 설치하세요.

  • ComfyUI-GGUF

  • ComfyUI-VideoHelperSuite

  • ComfyUI-KJNodes

  • ComfyUI-ControlNet-Aux

  • ComfyUI-Frame-Interpolation

  • ComfyUI-Easy-Use

📖 단계별 가이드

초기 설정

  1. 상수 설정:

    • 가로/세로: 576x1024(9:16 비율) 또는 소스 비디오와 동일하게 설정

    • 길이: 세그먼트당 81 프레임

    • 건너뛸 프레임: 0으로 시작

    • 파일명 접두사: 출력 폴더 및 접두사 설정

  2. 소스 자료 로드:

    • 재스타일링할 소스 비디오 로드

    • 참조 이미지 로드(비디오 첫 프레임과 유사한 포즈를 확보)

    • 최적의 포즈 매칭을 위해 SDXL/FLUX + LoRA 및 ControlNet 사용

단계 1: WAN 비디오 생성

  1. 프롬프트 작성:

    • 주체, 옷차림, 배경을 상세히 설명

    • 동적 결과를 위해 액션 표현 포함

  2. 비디오 세그먼트 생성:

    • 실행 버튼을 눌러 첫 81프레임 세그먼트 생성

    • 다음 세그먼트를 처리하려면 건너뛸 프레임을 81씩 증가

    • 소스 비디오 전체 길이에 걸쳐 반복

    • 최종 세그먼트는 짧을 수 있으며 품질이 낮아질 수 있음

    • 긴 비디오의 경우: 전체 길이를 커버할 때까지 이 프로세스를 반복

단계 2: 비디오 원활하게 결합

  1. 결합 설정:

    • 생성된 비디오가 저장된 폴더 경로 설정

    • 생성된 파일과 일치하는 파일명 접두사 설정

    • 파일명 접미사 시작값: 1

    • 단계 1에서 사용한 프롬프트 동일하게 사용

  2. 결합 프로세스:

    • 첫 번째와 두 번째 비디오를 결합하기 위해 실행

    • 파일명 접미사를 1씩 증가

    • 두 번째와 세 번째 비디오를 결합하기 위해 실행

    • 모든 세그먼트가 결합될 때까지 반복

단계 3: 통합, 업스케일, 보간

  1. 최종 처리 설정:

    • 결합된 비디오가 저장된 폴더 경로 설정

    • 파일명 접미사: 1(고정)

    • 최종 출력용 통합 파일명 설정

    • 향상된 버전용 업스케일 파일명 설정

  2. 최종 파이프라인 실행:

    • 모든 결합된 비디오 통합

    • RealESRGAN을 사용하여 업스케일(2배 확대)

    • FILM VFI를 사용하여 프레임 보간(2배 프레임 속도)


⚙️ 고급 설정

저 VRAM 구성

  • 메모리 최적화를 위해 UnetLoaderGGUFDisTorchMultiGPU 노드 사용

  • 12GB 이하 GPU의 경우 virtual_vram_gb를 2.0–4.0으로 설정

  • 추가 메모리 백업을 위해 use_other_vram 활성화

성능 최적화

  • Triton이 없으면 PathchSageAttentionKJ 및 ModelPatchTorchSettings를 생략

  • GPU 메모리에 따라 배치 크기 조정

  • 하드웨어에 적합한 양자화 레벨 사용


🎯 최상의 결과를 위한 팁

  1. 긴 비디오 전략: 81프레임 세그먼트는 원활한 전환을 보장하면서도 처리 단위를 관리 가능하게 유지

  2. 참조 이미지 품질: 소스 비디오의 첫 프레임과 유사한 포즈를 가진 고품질 참조 이미지 사용

  3. 프롬프트 설계: 주체의 세부사항, 옷, 배경 요소를 구체적으로 명시

  4. 세그먼트 계획: 전체 비디오 길이에 걸쳐 서사적 일관성 유지

  5. 하드웨어 고려: GPU 성능에 따라 설정 조정 — 긴 비디오는 최적화된 VRAM 설정의 혜택을 받음

  6. 일관성 유지: 모든 세그먼트에서 프롬프트를 일관되게 유지하여 최종 긴 비디오의 시각적 통일성 확보


🩺 문제 해결

  • OOM 오류: virtual_vram_gb 증가 또는 배치 크기 감소

  • 노드 누락: 모든 커스텀 노드가 정확히 설치되었는지 확인

  • 품질 문제: 참조 이미지 정렬 및 프롬프트 구체성 점검

  • 처리 속도 느림: 더 빠른 생성을 위해 낮은 양자화 모델 사용 고려


🔧 커스텀 노드 매개변수 가이드

WanVideoVaceSeamlessJoin 노드

이 커스텀 노드는 지능형 마스킹을 사용하여 두 비디오 클립을 원활하게 결합합니다.

매개변수:

  • mask_last_frames(INT): 첫 번째 비디오 끝부분에 마스크를 적용할 프레임 수

    • 기본값: 0

    • 범위: 0-20

    • 마스킹 없음: 0, 부드러운 블렌딩: 5-10

  • mask_first_frames(INT): 두 번째 비디오 시작부분에 마스크를 적용할 프레임 수

    • 기본값: 10

    • 범위: 0-20

    • 원활한 전환을 위해 권장: 10 프레임

  • frame_load_cap(INT): 각 비디오에서 로드할 최대 프레임 수

    • 기본값: 81

    • 범위: 1-1000

    • 세그먼트 길이와 일치(일반적으로 81)

  • first_video_path(STRING): 첫 번째 비디오 파일의 전체 경로

    • 형식: "C:\path\to\video1.mp4"

    • 신뢰성 위해 절대 경로 사용

  • second_video_path(STRING): 두 번째 비디오 파일의 전체 경로

    • 형식: "C:\path\to\video2.mp4"

    • 파일이 존재하고 접근 가능해야 함

출력:

  • image: 결합된 비디오 프레임을 이미지 시퀀스로

  • mask: 전환 영역용 생성 마스크


CombineVideoClips 노드

이 노드는 고급 마스킹 옵션을 사용하여 여러 비디오 클립을 단일 연속 시퀀스로 결합합니다.

매개변수:

  • frame_load_cap(INT): 각 비디오당 로드할 최대 프레임 수

    • 기본값: 81

    • 범위: 1-1000

    • 세그먼트 프레임 수와 일치

  • mask_last_frames(INT): 각 비디오 끝부분(마지막 제외)에 마스크를 적용할 프레임 수

    • 기본값: 0

    • 범위: 0-20

    • _ cleanly 절단: 0, 페이드 효과: 5-10_

  • mask_first_frames(INT): 각 비디오 시작부분(첫 번째 제외)에 마스크를 적용할 프레임 수

    • 기본값: 10

    • 범위: 0-20

    • 원활한 전환을 위해 권장: 10

  • first_video_path(STRING): 시퀀스의 첫 번째 비디오 경로

    • 기본 비디오 — 일반적으로 생성된 원본 비디오
  • first_joined_video_path(STRING): 첫 번째 원활하게 결합된 비디오 경로

    • 첫 번째 WanVideoVaceSeamlessJoin 결과
  • second_joined_video_path(STRING): 두 번째 원활하게 결합된 비디오 경로

    • 두 번째 WanVideoVaceSeamlessJoin 결과
  • third_joined_video_path(STRING): 세 번째 원활하게 결합된 비디오 경로

    • 추가 세그먼트에 따라 계속
  • fourth_joined_video_path(STRING): 네 번째 원활하게 결합된 비디오 경로

    • 옵션 — 이 세그먼트 수가 있는 경우 사용
  • fifth_joined_video_path(STRING): 다섯 번째 원활하게 결합된 비디오 경로

    • 옵션 — 지원 최대 세그먼트 수
  • last_video_path(STRING): 시퀀스의 마지막 비디오 경로

    • 마지막 생성된 비디오 세그먼트

출력:

  • image: 최종 처리용 결합된 비디오 시퀀스(이미지 프레임)

매개변수 최적화 팁:

원활한 결합 시:

  • 짧은 전환: mask_first_frames = 5, mask_last_frames = 0

  • 부드러운 블렌딩: mask_first_frames = 10, mask_last_frames = 5

  • 긴 크로스페이드: mask_first_frames = 15, mask_last_frames = 10

파일 경로 시:

  • 실행 전 모든 비디오 파일이 존재하는지 확인

  • 배치 처리를 위해 일관된 파일명 규칙 사용

프레임 수 고려 사항:

  • frame_load_cap을 세그먼트 길이(일반적으로 81)와 일치

  • 작은 값은 긴 세그먼트를 자르는 결과를 초래할 수 있음


이 워크플로우는 생성부터 최종 출력까지 전체 파이프라인에 대한 포괄적인 제어를 제공하는 전문 수준의 비디오 변환 기능을 제공합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.