WAN 2.2 S2V Lipsync Workflow with SageAttention + BlockSwap + GGUF (include Upscale and Interpolation)
세부 정보
파일 다운로드
모델 설명
안녕하세요! ComfyUI에서 Wan 2.2 S2V 비디오 생성을 위한 제 작업 워크플로우를 소개합니다.
Wan 2.2 S2V 모델이 필요합니다.
Wan 2.2 모델(https://huggingface.co/Kijai/WanVideo_comfy_fp8_scaled/tree/main/S2V), clip(https://huggingface.co/Kijai/WanVideo_comfy/blob/main/umt5-xxl-enc-bf16.safetensors), audio_encoder(https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/audio_encoders) 및 vae(Wan 2.1 vae)가 필요합니다.
GGUF - https://huggingface.co/QuantStack/Wan2.2-S2V-14B-GGUF/tree/main
또한 더 나은 및 빠른 생성을 위해 Lora https://huggingface.co/Kijai/WanVideo_comfy/tree/main/Lightx2v를 포함했습니다.
최상의 결과를 얻으려면 Lora의 strength를 1.5로 설정하는 것이 좋습니다.
또한 빠른 생성을 위해 Sageattention 2.2.0 with Triton(https://huggingface.co/Kijai/PrecompiledWheels/tree/main)과 Torch 2.7.0+(https://github.com/pytorch/pytorch/releases)가 필요하며, CUDA 12.8(https://developer.nvidia.com/cuda-12-8-0-download-archive) 및 VS Code(https://visualstudio.microsoft.com/downloads/)를 다운로드하고 설치해야 합니다.
Sageattention 설치 방법 안내 (1.0.6, Sageattention 2.2.0 설치 방법: .whl 파일을 .zip으로 이름을 변경한 후 .zip에서 폴더를 ComfyUI\python_embeded\Lib\site-packages로 복사)
오디오, 이미지, 프롬프트를 입력하고 즐기세요!
문제가 있거나 워크플로우에 문제가 있다면 댓글을 남겨주세요.
