ComfyUI beginner friendly WAN 2.2 Image-to-Video with Audio GGUF Workflow by SarcasticTOFU

세부 정보

모델 설명

이것은 단일 입력 이미지와 일치하는 오디오 클립과 함께 작동하는 매우 간단하고 ComfyUI 초보자 친화적인 이미지-비디오 워크플로우입니다. 이 워크플로우는 단일 WAN 2.2 S2V GGUF 모델(오디오 클립과 함께 비디오를 인코딩하는 더 최신의 WAN 2.2 모델)을 사용합니다. 워크플로우가 간단하고 빠르기 때문에 상대적으로 저사양의 GPU(12GB/16GB Nvidia 또는 Radeon GPU 또는 일부 더 경제적인 Apple Silicon Mac)에서도 WAN 2.2를 더 효율적인 시스템 자원으로 실행할 수 있습니다. (ComfyUI Manager 및 LORA Manager 플러그인을 설치하여 체크포인트, LORAs 및 기타 리소스를 쉽게 다운로드하고 관리하는 것이 좋습니다. 이 두 플러그인은 이 워크플로우에 유용할 뿐만 아니라 다른 모든 경우에도 매우 도움이 됩니다.) 필요한 WAN 2.2 S2V 파일을 다운로드하려면 Hugging Face 계정이 필요합니다(세부 사항은 아래에 설명되어 있습니다). ComfyUI Manager를 사용하여 ComfyUI에 GGUF 애드온을 설치하고, 올바른 파일을 올바른 위치에 배치해야 합니다. 또한 SD 1.5 + SDXL 1.0, WAN 2.1, WAN 2.2 All-in-One, Chroma, QWEN, HiDream 및 Flux를 위한 다른 워크플로우도 확인해 보세요.

사용 방법 -

#1. 먼저 원하는 WAN 2.2 S2V GGUF 모델과 기타 필요한 모델을 선택하세요.

#2. 그런 다음 이미지-비디오 생성을 위한 입력 이미지와 일치하는 오디오 클립을 선택하세요.

#3. 그 다음 긍정적 및 부정적 프롬프트를 입력하세요.

#4. 배치 설정을 선택하세요(이 섹션의 참고 사항을 따르세요) 및 생성할 비디오의 수를 지정하세요(“Run” 버튼 옆의 숫자를 변경하세요).

#5. 마지막으로 Run 버튼을 눌러 생성하세요. 끝입니다.

*** Stability Matrix를 통해 관리되는 ComfyUI를 사용하는 경우 오디오 인코더를 Stability Matrix의 공용 모델 서브폴더가 아닌 ComfyUI 패키지 서브폴더 내의 models 서브폴더에 다운로드하고 배치해야 합니다. 즉, <Stability Matrix 데이터 폴더>/Packages/ComfyUI/models/audio_encoders에 넣어야 하며, <Stability Matrix 데이터 폴더>/Models/audio_encoders(ComfyUI, WebUI Forge, SD.Next 등 Stability Matrix를 통해 설치 및 관리할 수 있는 여러 도구 간에 공유되는 일반적인 모델 서브폴더)에는 넣지 마세요. 이 과정을 올바르게 수행하지 않으면 이 워크플로우가 작동하지 않습니다.

즐겁게 사용하세요!

### 이 워크플로우를 사용하려면 Hugging Face에 로그인하여 해당 사이트에서 필요한 파일을 다운로드해야 합니다(또한 아카이브에 워크플로우 파일과 함께 텍스트 파일을 포함시켰으며, 이 파일에는 다른 워크플로우를 위한 더 많은 필수 다운로드 링크가 포함되어 있습니다) -

## WAN 2.2 모델

===============================================================================================================

### WAN 2.2 S2V 체크포인트 다운로드 링크

https://huggingface.co/QuantStack/Wan2.2-S2V-14B-GGUF/resolve/main/Wan2.2-S2V-14B-Q2_K.gguf

### WAN 2.2 인코더 다운로드 링크

https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/blob/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors

### WAN 2.1 VAE 다운로드 링크 (WAN 2.2 S2V 모델은 WAN 2.1 VAE를 사용합니다)

https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors

### WAN 2.2 S2V용 이미지-비디오 라이트닝 LoRA 다운로드 링크

https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/resolve/main/split_files/loras/wan2.2_t2v_lightx2v_4steps_lora_v1.1_high_noise.safetensors

### WAN 2.2 S2V용 이미지-비디오 오디오 인코더 다운로드 링크

https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/resolve/main/split_files/audio_encoders/wav2vec2_large_english_fp16.safetensors

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.