WAN VACE Professional Video-to-Video Complete Workflow

🎬 WAN VACE를 사용한 전문적인 비디오에서 비디오로의 변환

이 통합 ComfyUI 워크플로우를 사용하여 WAN VACE로 전문 수준의 화질로 비디오를 변환하세요. 이 전체 파이프라인은 장편 비디오의 원활한 비디오-비디오 변환을 가능하게 하며, 원활한 연결, 업스케일링 및 프레임 보간 같은 고급 기능을 포함합니다. 긴 비디오를 관리 가능한 세그먼트로 분할하고 개별적으로 처리한 후, 일관되고 고품질의 출력물로 원활하게 결합하세요.

✨ 핵심 기능

장비디오 처리: 세그먼트로 분할하여 원활하게 재결합하여 긴 비디오 콘텐츠 처리
완전한 V2V 파이프라인: 비디오-비디오 변환을 위한 전체 워크플로우
원활한 비디오 결합: 보이지 않는 전환을 위한 전문적인 비디오 연결 전용 커스텀 노드
다단계 프로세스: 생성 → 결합 → 통합 → 업스케일 → 보간
전문 품질: 사용자 정의 설정으로 고품질 출력
메모리 최적화: 다양한 GPU 구성에 맞는 저 VRAM 옵션
배치 처리: 여러 비디오 세그먼트를 효율적으로 처리
확장 가능한 아키텍처: 지능형 세그먼트화로 어떤 길이의 비디오라도 처리 가능

📋 요구사항

필수 모델 파일

🔴 WAN GGUF 모델

다운로드: QuantStack/Wan2.1_T2V_14B_FusionX_VACE-GGUF
원하는 양자화(Q3_K_S, Q8_0 등) 선택
위치: ComfyUI/models/unet

🟣 WAN VAE

wan_2.1_vae.safetensors 다운로드: Comfy-Org/Wan_2.1_ComfyUI_repackaged
위치: ComfyUI/models/vae

🟣 WAN 텍스트 인코더

GGUF 텍스트 인코더 다운로드: city96/umt5-xxl-encoder-gguf
위치: ComfyUI/models/text_encoders

필수 커스텀 노드

⚠️ 중요: 이 페이지에서 다음 커스텀 노드를 다운로드하세요(ComfyUI-Manager에서는 사용 불가):

seamless_join_video_clips.py
combine_video_clips.py
위치: ComfyUI/custom_nodes/

ComfyUI 확장

⚙️ ComfyUI-Manager를 사용하여 다음 커스텀 노드를 설치하세요.

ComfyUI-GGUF
ComfyUI-VideoHelperSuite
ComfyUI-KJNodes
ComfyUI-ControlNet-Aux
ComfyUI-Frame-Interpolation
ComfyUI-Easy-Use

📖 단계별 가이드

초기 설정

상수 설정:
- 가로/세로: 576x1024(9:16 비율) 또는 소스 비디오와 동일하게 설정
- 길이: 세그먼트당 81 프레임
- 건너뛸 프레임: 0으로 시작
- 파일명 접두사: 출력 폴더 및 접두사 설정
소스 자료 로드:
- 재스타일링할 소스 비디오 로드
- 참조 이미지 로드(비디오 첫 프레임과 유사한 포즈를 확보)
- 최적의 포즈 매칭을 위해 SDXL/FLUX + LoRA 및 ControlNet 사용

단계 1: WAN 비디오 생성

프롬프트 작성:
- 주체, 옷차림, 배경을 상세히 설명
- 동적 결과를 위해 액션 표현 포함
비디오 세그먼트 생성:
- 실행 버튼을 눌러 첫 81프레임 세그먼트 생성
- 다음 세그먼트를 처리하려면 건너뛸 프레임을 81씩 증가
- 소스 비디오 전체 길이에 걸쳐 반복
- 최종 세그먼트는 짧을 수 있으며 품질이 낮아질 수 있음
- 긴 비디오의 경우: 전체 길이를 커버할 때까지 이 프로세스를 반복

단계 2: 비디오 원활하게 결합

결합 설정:
- 생성된 비디오가 저장된 폴더 경로 설정
- 생성된 파일과 일치하는 파일명 접두사 설정
- 파일명 접미사 시작값: 1
- 단계 1에서 사용한 프롬프트 동일하게 사용
결합 프로세스:
- 첫 번째와 두 번째 비디오를 결합하기 위해 실행
- 파일명 접미사를 1씩 증가
- 두 번째와 세 번째 비디오를 결합하기 위해 실행
- 모든 세그먼트가 결합될 때까지 반복

단계 3: 통합, 업스케일, 보간

최종 처리 설정:
- 결합된 비디오가 저장된 폴더 경로 설정
- 파일명 접미사: 1(고정)
- 최종 출력용 통합 파일명 설정
- 향상된 버전용 업스케일 파일명 설정
최종 파이프라인 실행:
- 모든 결합된 비디오 통합
- RealESRGAN을 사용하여 업스케일(2배 확대)
- FILM VFI를 사용하여 프레임 보간(2배 프레임 속도)

⚙️ 고급 설정

저 VRAM 구성

메모리 최적화를 위해 UnetLoaderGGUFDisTorchMultiGPU 노드 사용
12GB 이하 GPU의 경우 virtual_vram_gb를 2.0–4.0으로 설정
추가 메모리 백업을 위해 use_other_vram 활성화

성능 최적화

Triton이 없으면 PathchSageAttentionKJ 및 ModelPatchTorchSettings를 생략
GPU 메모리에 따라 배치 크기 조정
하드웨어에 적합한 양자화 레벨 사용

🎯 최상의 결과를 위한 팁

긴 비디오 전략: 81프레임 세그먼트는 원활한 전환을 보장하면서도 처리 단위를 관리 가능하게 유지
참조 이미지 품질: 소스 비디오의 첫 프레임과 유사한 포즈를 가진 고품질 참조 이미지 사용
프롬프트 설계: 주체의 세부사항, 옷, 배경 요소를 구체적으로 명시
세그먼트 계획: 전체 비디오 길이에 걸쳐 서사적 일관성 유지
하드웨어 고려: GPU 성능에 따라 설정 조정 — 긴 비디오는 최적화된 VRAM 설정의 혜택을 받음
일관성 유지: 모든 세그먼트에서 프롬프트를 일관되게 유지하여 최종 긴 비디오의 시각적 통일성 확보

🩺 문제 해결

OOM 오류: virtual_vram_gb 증가 또는 배치 크기 감소
노드 누락: 모든 커스텀 노드가 정확히 설치되었는지 확인
품질 문제: 참조 이미지 정렬 및 프롬프트 구체성 점검
처리 속도 느림: 더 빠른 생성을 위해 낮은 양자화 모델 사용 고려

🔧 커스텀 노드 매개변수 가이드

WanVideoVaceSeamlessJoin 노드

이 커스텀 노드는 지능형 마스킹을 사용하여 두 비디오 클립을 원활하게 결합합니다.

매개변수:

mask_last_frames(INT): 첫 번째 비디오 끝부분에 마스크를 적용할 프레임 수
- 기본값: 0
- 범위: 0-20
- 마스킹 없음: 0, 부드러운 블렌딩: 5-10
mask_first_frames(INT): 두 번째 비디오 시작부분에 마스크를 적용할 프레임 수
- 기본값: 10
- 범위: 0-20
- 원활한 전환을 위해 권장: 10 프레임
frame_load_cap(INT): 각 비디오에서 로드할 최대 프레임 수
- 기본값: 81
- 범위: 1-1000
- 세그먼트 길이와 일치(일반적으로 81)
first_video_path(STRING): 첫 번째 비디오 파일의 전체 경로
- 형식: "C:\path\to\video1.mp4"
- 신뢰성 위해 절대 경로 사용
second_video_path(STRING): 두 번째 비디오 파일의 전체 경로
- 형식: "C:\path\to\video2.mp4"
- 파일이 존재하고 접근 가능해야 함

출력:

image: 결합된 비디오 프레임을 이미지 시퀀스로
mask: 전환 영역용 생성 마스크

CombineVideoClips 노드

이 노드는 고급 마스킹 옵션을 사용하여 여러 비디오 클립을 단일 연속 시퀀스로 결합합니다.

매개변수:

frame_load_cap(INT): 각 비디오당 로드할 최대 프레임 수
- 기본값: 81
- 범위: 1-1000
- 세그먼트 프레임 수와 일치
mask_last_frames(INT): 각 비디오 끝부분(마지막 제외)에 마스크를 적용할 프레임 수
- 기본값: 0
- 범위: 0-20
- _ cleanly 절단: 0, 페이드 효과: 5-10_
mask_first_frames(INT): 각 비디오 시작부분(첫 번째 제외)에 마스크를 적용할 프레임 수
- 기본값: 10
- 범위: 0-20
- 원활한 전환을 위해 권장: 10
first_video_path(STRING): 시퀀스의 첫 번째 비디오 경로
- 기본 비디오 — 일반적으로 생성된 원본 비디오
first_joined_video_path(STRING): 첫 번째 원활하게 결합된 비디오 경로
- 첫 번째 WanVideoVaceSeamlessJoin 결과
second_joined_video_path(STRING): 두 번째 원활하게 결합된 비디오 경로
- 두 번째 WanVideoVaceSeamlessJoin 결과
third_joined_video_path(STRING): 세 번째 원활하게 결합된 비디오 경로
- 추가 세그먼트에 따라 계속
fourth_joined_video_path(STRING): 네 번째 원활하게 결합된 비디오 경로
- 옵션 — 이 세그먼트 수가 있는 경우 사용
fifth_joined_video_path(STRING): 다섯 번째 원활하게 결합된 비디오 경로
- 옵션 — 지원 최대 세그먼트 수
last_video_path(STRING): 시퀀스의 마지막 비디오 경로
- 마지막 생성된 비디오 세그먼트

출력:

image: 최종 처리용 결합된 비디오 시퀀스(이미지 프레임)

매개변수 최적화 팁:

원활한 결합 시:

짧은 전환: mask_first_frames = 5, mask_last_frames = 0
부드러운 블렌딩: mask_first_frames = 10, mask_last_frames = 5
긴 크로스페이드: mask_first_frames = 15, mask_last_frames = 10

파일 경로 시:

실행 전 모든 비디오 파일이 존재하는지 확인
배치 처리를 위해 일관된 파일명 규칙 사용

프레임 수 고려 사항:

frame_load_cap을 세그먼트 길이(일반적으로 81)와 일치
작은 값은 긴 세그먼트를 자르는 결과를 초래할 수 있음

이 워크플로우는 생성부터 최종 출력까지 전체 파이프라인에 대한 포괄적인 제어를 제공하는 전문 수준의 비디오 변환 기능을 제공합니다.

모델 유형	워크플로우
기본 모델	Wan Video 2.2 I2V-A14B
게시일	9/27/2025