WAN 2.2 IMAGE to VIDEO with Caption and Postprocessing

세부 정보

모델 설명

워크플로우: 이미지 -> 자동 캡션(프롬프트) -> WAN I2V(업스케일 및 프레임 보간 및 비디오 확장 포함)

  • 480p 또는 720p 해상도로 비디오 클립을 생성합니다.

Florence 캡션 버전과 LTX Prompt Enhancer(LTXPE) 버전이 있습니다. LTXPE는 VRAM을 더 많이 사용하므로, 문제가 발생하면 다음 스레드를 참조하세요: /model/1823416?dialog=commentThread&commentId=955337


MultiClip LTXPE PLUS: Wan 2.2. 14B I2V 버전 — 아래 MultiClip 워크플로우를 기반으로 개선된 LTX 프롬프트 엔하서(LTXPE) 기능을 사용합니다(워크플로우 내 참고사항 참조). 먼저 아래 MultiClip 워크플로우를 시도해보는 것이 좋습니다.

이 워크플로우는 프롬프트 생성에 대한 제어를 강화하기 위해 LTXPE 기능을 개선하며, 검열되지 않은 언어 모델을 사용합니다. 비디오 생성 부분은 아래 버전과 동일합니다. 자세한 정보: /model/1823416?modelVersionId=2303138&dialog=commentThread&commentId=972440


MultiClip: Wan 2.2. 14B I2V 버전LightX2V Wan 2.2. LoRA를 지원하여 4-6단계로 클립을 생성하고 최대 3배까지 확장할 수 있습니다. 예시는 15-20초 길이로 게시되었습니다.

자신의 프롬프트를 사용할 수 있는 일반 버전과 자동 프롬프트 생성을 위한 LTXPE 버전이 있습니다. 일반 버전은 LoRA를 사용한 특정 또는 NSFW 클립에 잘 작동하며, LTXPE는 단순히 이미지를 업로드하고 너비/높이를 설정한 후 실행 버튼만 누르면 됩니다. 최종적으로 모든 클립이 하나의 전체 비디오로 결합됩니다.

  • 저단계(4-8단계)용 새로운 Wan 2.2. LightX2v LoRA 지원

  • 추가로 "이전" LightX2v Wan 2.1 LoRA를 주입할 수 있습니다. 이는 느린 움직임을 방지하고 더 역동적인 움직임을 도입하는 데 도움이 될 수 있습니다. (최신 LightX LoRA 버전(i.e. ver.1022)에서는 불필요할 수 있습니다.)

  • 시퀀스별로 Wan 2.2. LoRA 지원

  • 아래 V1.0 워크플로우와 대응하는 단일 클립 버전 포함. "이전" Wan 2.1. LightX2v LoRA용 추가 LoRA 로더 포함

Wan 2.2는 2개의 모델을 사용하므로 워크플로우가 복잡해집니다. 그러나 훨씬 가볍고 다양한 LoRA를 제공하는 Wan 2.1 MultiClip 버전도 확인해보시길 권장합니다. 여기서 찾을 수 있습니다: /model/1309065?modelVersionId=1998473


V1.0 WAN 2.2. 14B 이미지에서 비디오로 워크플로우 — LightX2v I2V Wan 2.2 LoRA를 지원하여 저단계(4-8단계)로 처리

  • Wan 2.2.는 클립을 처리하기 위해 고노이즈 모델과 저노이즈 모델을 순차적으로 사용합니다.

  • LightX2v LoRA와 호환되어 저단계로 빠르게 클립을 처리할 수 있습니다.

  • 일부 "이전" Wan2.1 LoRA 및 "새로운" Wan 2.2. LoRA와 호환

  • 워크플로우 및 아래 팁 참조

모델은 다음에서 다운로드 가능:

모델(고노이즈 및 저노이즈 필요, VRAM에 맞는 모델 선택): https://huggingface.co/bullerwins/Wan2.2-I2V-A14B-GGUF/tree/main

Wan 2.2.용 LightX2v LoRA (I2v, Hi 및 Lo): https://huggingface.co/Kijai/WanVideo_comfy/tree/main/LoRAs/Wan22-Lightning/old

2025년 10월 14일: 2개의 새로운 LightX 고노이즈 LoRA(MoE 및 1030) 출시 — 강도 > 1.5, 7단계, SD3 shift = 5.0으로 시도하세요. 고노이즈 LoRA를 교체:

https://huggingface.co/Kijai/WanVideo_comfy/tree/main/LoRAs/Wan22_Lightx2v

2025년 10월 22일: 새로운 LightX LoRA 출시(이름: 1022), 권장:

https://huggingface.co/lightx2v/Wan2.2-Distill-Loras/tree/main

LightX2v LoRA (이전 Wan 2.1): https://huggingface.co/lightx2v/Wan2.1-I2V-14B-480P-StepDistill-CfgDistill-Lightx2v/tree/main/loras

VAE (Wan 2.1과 동일): https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/tree/main/split_files/vae

Textencoder (Wan 2.1과 동일): https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/text_encoders


WAN 2.2. I2V 5B 모델(GGUF) 워크플로우 — Florence 또는 LTXPE 자동 캡션 지원

  • 14B 모델보다 품질이 낮음

  • 720p @ 24프레임

  • FastWan LoRA 사용 시 CFG를 1로 설정하고 4-5단계로 처리. Unet 로더 뒤에 LoRA 로더 노드를 삽입하여 LoRA를 주입하세요.

FastWan LoRA: https://huggingface.co/Kijai/WanVideo_comfy/tree/main/FastWan

모델(GGUF, VRAM에 맞는 모델 선택): https://huggingface.co/QuantStack/Wan2.2-TI2V-5B-GGUF/tree/main

VAE: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/vae

Textencoder (Wan 2.1과 동일): https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/text_encoders


ComfyUI 폴더 내 파일 저장 위치:

Wan GGUF 모델 -> models/unet

Textencoder -> models/clip

VAE -> models/vae


(14B 모델용):

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.