Wan 2.2 GGUF Workflow FTL (first to last image) with Upscale

세부 정보

파일 다운로드

모델 설명

이것은 제 이미지에서 비디오로(I2V) 워크플로우에서 사용하는 많은 노드와 동일하며, 저사양 VRAM GPU용으로도 설계되었습니다(저는 12GB를 사용하지만, Wan 2.2의 Q3 GGUF 파일을 사용하면 8GB에서도 작동한다는 것을 알고 있습니다).

일반적인 성능은 480p(480 x 832) 기준으로 56초의 비디오를 생성하는 데 약 45분이 소요됩니다. 이는 960 x 1664로 2배 확대하는 과정도 포함됩니다. 또한 저는 종종 RIFE를 사용한 32fps 최종 저장보다 '원본' 16fps를 더 자주 저장합니다. 이는 영상을 병합하기 쉽고, 후에 보간을 추가하는 것이 더 쉬우므로 보간되지 않은 영상으로 프레임 관리를 하는 편이 좋기 때문입니다.

저가 양자화를 사용하기 때문에 조명 설명을 사용하는 것이 민감하다는 점을 발견했습니다. 특히 81프레임(5초) 이상, 또는 97프레임(6초) 이상을 실행할 경우 상당한 조명 변화가 발생할 수 있습니다. 언젠가 충분한 여유 자금을 마련하여 PC를 업그레이드해 더 큰 빠른 RAM(VRAM만이 아닌)을 지원하게 되면, 더 큰 비양자화 모델을 사용할 수 있을 겁니다. 꿈꾸는 건 자유죠...

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.