Wan 2.2 GGUF Workflow I2V with Upscale

세부 정보

파일 다운로드

모델 설명

이 워크플로는 “작은” 그래픽 카드(특히 12GB)에서 실행되는 I2V 모델을 구성하고 구축하는 제 방식입니다. 저는 Q5 GGUF 모델을 사용하지만, 더 작은 Q4 및 Q3 모델도 테스트해보았습니다. 이들 모델은 프롬프트 준수도와 품질이 약간 낮아지지만 여전히 사용 가능합니다. 이 워크플로에는 Lightspeed LoRA를 사용하고, 모든 모델/LoRA를 다운로드할 수 있는 위치에 대한 설명이 포함되어 있습니다.

RAM 또는 VRAM이 제한적인 경우, ComfyUI를 --cache-none 매개변수와 함께 실행하는 것을 추천합니다.

이렇게 하면 동일한 비디오에 대해 여러 배치를 실행하는 속도가 느려지지만, 비디오 생성의 전체적인 속도가 훨씬 일관되게 유지됩니다(보통 가정용 PC 환경에서 56초 길이의 비디오 생성에 34분 소요).

또한 이미지 감지 및 자동 프롬프트 보조를 위해 Florence2(LLM)를 사용합니다. 원하는 경우 수동 프롬프트에 단지 액션을 추가하기만 하면 됩니다.

다양한 워크플로에서 본 많은 노드들이 있지만, 적어도 Wan 2.2 I2V에서는 이러한 노드들이 큰 영향을 미치지 않으며 오버헤드만 증가시킵니다.

저는 일반적으로 480p(480 x 832) 해상도로 비디오를 실행하고, 이 워크플로는 이를 2배로 확대하여 960 x 1664로 만듭니다.

사용된 커스텀 노드:

ComfyUI-GGUF (https://github.com/city96/ComfyUI-GGUF)

rgthree-comfy (https://github.com/rgthree/rgthree-comfy)

ComfyUI-KJNodes (https://github.com/kijai/ComfyUI-KJNodes)

ComfyUI-Florence2 (https://github.com/kijai/ComfyUI-Florence2)

ComfyUI-VideoHelperSuite (https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite)

WAS Node Suite (https://github.com/WASasquatch/was-node-suite-comfyui)

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.