HyVid - High Quality & Fast Speed Generation for 24GB Cards - Hunyuan Video Workflow

세부 정보

파일 다운로드

모델 설명

이 워크플로우를 사용하면 416x736 해상도, 24FPS, 5초 길이의 클립을 90-120초 내에 생성합니다.(생성에 약 75초, 디코딩에 약 25초 소요, 여러 LoRA와 BF16 모델 사용. 업스케일링은 추가 시간이 소요됩니다. [컴파일링 또는 TeaCache를 사용할 수 없으면 생성 시간이 더 길어집니다.]) 생성 중 약 18GB의 VRAM을 사용합니다.

이 워크플로우는 RTX 4090(24GB VRAM, 64GB RAM, Windows 10 환경)을 기준으로 설계되었습니다. 다른 하드웨어나 운영체제에 대한 추천은 제공할 수 없습니다.

Hunyuan 비디오의 BF16 모델을 Triton Torch 컴파일링과 TeaCache와 함께 사용할 때, 캐시가 준비된 후 90-120초 내에 생성이 가능합니다. (사용하는 Torch 버전에 따라 PyTorch 파일을 일부 수정해야 할 수 있으며, 워크플로우 노트에 가이드가 있습니다.) 모델 로딩 중 PC가 심하게 느려질 수 있으니 인내心을 가지고 기다려 주세요.

지금까지 가장 뛰어난 속도와 출력을 얻은 설정은 416x736 해상도(또는 전환된 형태), 121프레임(24FPS 기준으로 5초 클립), 스텝은 20-30 사이(사용하는 LoRA에 따라 다름)입니다.

테스트한 대부분의 LoRA는 0.5에서 1.0 사이의 강도에서 잘 작동합니다. 여러 LoRA를 혼합할 때는 하나 이상의 LoRA 강도를 낮춰야 할 수 있습니다. 흐릿하거나 그레인 있는 영상이 나오면 강도를 더 낮춰보세요.

이러한 발견은 대부분 실험과 오류를 통해 이루어졌으며, 특히 Triton Torch 컴파일링과 TeaCache 관련해서는 현재 설정 외에는 별도로 도움을 드리기 어렵습니다. Windows에서 Triton을 설치하는 것은 극도로 어려웠으며, 나는 다음 가이드를 사용했습니다: https://old.reddit.com/r/StableDiffusion/comments/1h7hunp/how_to_run_hunyuanvideo_on_a_single_24gb_vram_card/

이 모든 것이 kijai와 ComfyUI-HunyuanVideoWrapper 개발팀 없이는 불가능했습니다. 이들에게 큰 박수를 보냅니다.

다음 커스텀 노드 패키지가 필요합니다

다음 모델이 필요합니다

업스케일 및 프레임 보간 모델

이 워크플로우가 도움이 되셨다면, LoRA 학습 및 워크플로우 개발을 위해 버즈 기부를 고려해 주세요.

향상점이나 문제점을 발견하시면 게시물에 댓글을 남겨주세요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.