Hunyuan I2V (Image to Video) - Simplest / 12Gb VRAM - Full HD
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
초보자들이 이해하고 배우기 매우 쉬운 가장 간단한 Hunyuan I2V(이미지에서 영상으로) ComfyUI 워크플로를 소개합니다.
이 워크플로는 오토 프롬프팅이나 프레임 보간 같은 기능을 추가하여 쉽게 확장할 수 있지만, 단순성과 이해의 용이성을 위해 여기서는 해당 노드를 추가하지 않았습니다...
저의 저VRAM(단지 12GB...) 트릭은 생성된 영상의 초기 해상도에 숨겨져 있습니다(풀HD의 정확히 절반: (1920/1088)/2 = 960/544), 그리고 저해상도 이미지/영상 복원을 학습한 2x 모델로 이를 업스케일링합니다.
이러한 모델 중 하나는 여기서 얻을 수 있습니다: https://openmodeldb.info/users/helaman – 제 경우 이 모델을 사용합니다: https://openmodeldb.info/models/2x-NomosUni-compact-otf-medium
또한, Kijai가 만든 Hunyuan Video 양자화 버전을 사용하여 워크플로를 부분적으로 fp8_e4m3fn으로 실행하고 있으며, CimfyUI 명령줄에 두 개의 추가 옵션을 추가했습니다: --fp8_e4m3fn-unet --fp8_e4m3fn-text-enc, 그리고 디퓨전 모델 로더의 가중치 유형을 fp8_e4m3fn으로 선택했습니다(+ DualClipLoader 노드에서 고급 옵션을 켜서 GPU 메모리가 아닌 CPU로 보냅니다).
생성된 출력 파일의 경우, 1088 픽셀에서 1080 픽셀로 약간 자르면 순수한 9:16 비율을 얻을 수 있습니다. 가로 영상이 필요하다면, 해당 노드에서 숫자를 뒤집기만 하면 됩니다 ;)
면책조항: 이 워크플로는 다음 공식 ComfyUI 예제를 수정한 것입니다: https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/
멋진 영상 만들기 위해 행운을 빕니다 ;)
