WAN 2.2 IMAGE to VIDEO with Caption and Postprocessing
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
워크플로우: 이미지 -> 자동 캡션(프롬프트) -> WAN I2V(업스케일 및 프레임 보간 및 비디오 확장 포함)
- 480p 또는 720p 해상도로 비디오 클립을 생성합니다.
Florence 캡션 버전과 LTX Prompt Enhancer(LTXPE) 버전이 있습니다. LTXPE는 VRAM을 더 많이 사용하므로, 문제가 발생하면 다음 스레드를 참조하세요: /model/1823416?dialog=commentThread&commentId=955337
MultiClip LTXPE PLUS: Wan 2.2. 14B I2V 버전 — 아래 MultiClip 워크플로우를 기반으로 개선된 LTX 프롬프트 엔하서(LTXPE) 기능을 사용합니다(워크플로우 내 참고사항 참조). 먼저 아래 MultiClip 워크플로우를 시도해보는 것이 좋습니다.
이 워크플로우는 프롬프트 생성에 대한 제어를 강화하기 위해 LTXPE 기능을 개선하며, 검열되지 않은 언어 모델을 사용합니다. 비디오 생성 부분은 아래 버전과 동일합니다. 자세한 정보: /model/1823416?modelVersionId=2303138&dialog=commentThread&commentId=972440
MultiClip: Wan 2.2. 14B I2V 버전 — LightX2V Wan 2.2. LoRA를 지원하여 4-6단계로 클립을 생성하고 최대 3배까지 확장할 수 있습니다. 예시는 15-20초 길이로 게시되었습니다.
자신의 프롬프트를 사용할 수 있는 일반 버전과 자동 프롬프트 생성을 위한 LTXPE 버전이 있습니다. 일반 버전은 LoRA를 사용한 특정 또는 NSFW 클립에 잘 작동하며, LTXPE는 단순히 이미지를 업로드하고 너비/높이를 설정한 후 실행 버튼만 누르면 됩니다. 최종적으로 모든 클립이 하나의 전체 비디오로 결합됩니다.
저단계(4-8단계)용 새로운 Wan 2.2. LightX2v LoRA 지원
추가로 "이전" LightX2v Wan 2.1 LoRA를 주입할 수 있습니다. 이는 느린 움직임을 방지하고 더 역동적인 움직임을 도입하는 데 도움이 될 수 있습니다. (최신 LightX LoRA 버전(i.e. ver.1022)에서는 불필요할 수 있습니다.)
시퀀스별로 Wan 2.2. LoRA 지원
아래 V1.0 워크플로우와 대응하는 단일 클립 버전 포함. "이전" Wan 2.1. LightX2v LoRA용 추가 LoRA 로더 포함
Wan 2.2는 2개의 모델을 사용하므로 워크플로우가 복잡해집니다. 그러나 훨씬 가볍고 다양한 LoRA를 제공하는 Wan 2.1 MultiClip 버전도 확인해보시길 권장합니다. 여기서 찾을 수 있습니다: /model/1309065?modelVersionId=1998473
V1.0 WAN 2.2. 14B 이미지에서 비디오로 워크플로우 — LightX2v I2V Wan 2.2 LoRA를 지원하여 저단계(4-8단계)로 처리
Wan 2.2.는 클립을 처리하기 위해 고노이즈 모델과 저노이즈 모델을 순차적으로 사용합니다.
LightX2v LoRA와 호환되어 저단계로 빠르게 클립을 처리할 수 있습니다.
일부 "이전" Wan2.1 LoRA 및 "새로운" Wan 2.2. LoRA와 호환
워크플로우 및 아래 팁 참조
모델은 다음에서 다운로드 가능:
모델(고노이즈 및 저노이즈 필요, VRAM에 맞는 모델 선택): https://huggingface.co/bullerwins/Wan2.2-I2V-A14B-GGUF/tree/main
Wan 2.2.용 LightX2v LoRA (I2v, Hi 및 Lo): https://huggingface.co/Kijai/WanVideo_comfy/tree/main/LoRAs/Wan22-Lightning/old
2025년 10월 14일: 2개의 새로운 LightX 고노이즈 LoRA(MoE 및 1030) 출시 — 강도 > 1.5, 7단계, SD3 shift = 5.0으로 시도하세요. 고노이즈 LoRA를 교체:
https://huggingface.co/Kijai/WanVideo_comfy/tree/main/LoRAs/Wan22_Lightx2v
2025년 10월 22일: 새로운 LightX LoRA 출시(이름: 1022), 권장:
https://huggingface.co/lightx2v/Wan2.2-Distill-Loras/tree/main
LightX2v LoRA (이전 Wan 2.1): https://huggingface.co/lightx2v/Wan2.1-I2V-14B-480P-StepDistill-CfgDistill-Lightx2v/tree/main/loras
VAE (Wan 2.1과 동일): https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/tree/main/split_files/vae
Textencoder (Wan 2.1과 동일): https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/text_encoders
WAN 2.2. I2V 5B 모델(GGUF) 워크플로우 — Florence 또는 LTXPE 자동 캡션 지원
14B 모델보다 품질이 낮음
720p @ 24프레임
FastWan LoRA 사용 시 CFG를 1로 설정하고 4-5단계로 처리. Unet 로더 뒤에 LoRA 로더 노드를 삽입하여 LoRA를 주입하세요.
FastWan LoRA: https://huggingface.co/Kijai/WanVideo_comfy/tree/main/FastWan
모델(GGUF, VRAM에 맞는 모델 선택): https://huggingface.co/QuantStack/Wan2.2-TI2V-5B-GGUF/tree/main
VAE: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/vae
Textencoder (Wan 2.1과 동일): https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/text_encoders
ComfyUI 폴더 내 파일 저장 위치:
Wan GGUF 모델 -> models/unet
Textencoder -> models/clip
VAE -> models/vae
팁(14B 모델용):
Wan 2.2 및 LoRA가 혼란스러우신가요? 다음 스레드 참조: /model/1823416?modelVersionId=2063446&dialog=commentThread&commentId=890870
Wan 2.2. I2V 프롬프팅 팁: /model/1823416?modelVersionId=2063446&dialog=commentThread&commentId=890880
어떤 GGUF 모델을 다운로드해야 하나요? 일반적으로 16GB VRAM/64GB RAM 환경에서는 약 10GB 크기의 모델(예: "...Q4_K_M.gguf")을 선택합니다.
LTXPE용 검열되지 않은 모델: "chuanli11/Llama-3.2-3B-Instruct-uncensored". LTXPE 로더 노드 내 LLM_name을 교체하세요.
LightX LoRA 강도(약 1.5)를 조정하여 움직임을 증가시키고 느린 움직임을 줄이세요.

