Hunyuan YAW 6.7 (Yet another workflow) T2V I2V V2V audio, extend, random-lora, preview pause, upscale, multi-res, interpolate,prompt save/load,teacache,new interface, Fast
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
V6.9 버그 수정, 더 많은 호환되지 않는 노드 제거. ComfyUI 및 커스텀 노드의 빈번한 업데이트를 따라잡는 것이 매우 어렵습니다. 이 버전이 여러분에게 잘 작동하기를 바랍니다.
V6.7 I2V 버그 수정, 조합을 통한 비디오 확장 기능 추가, 시스템에서 사용 가능한 경우 Triton 가속 기능 추가. 이 버전이 일정 기간 동안 버그 없이 작동하길 바랍니다. ComfyUI, 모델 및 커스텀 노드의 변화를 계속 따라잡는 것이 정말 힘듭니다. 현재로서는 Wan이 I2V에 더 나은 것 같네요. 이 워크플로우를 실행하려면 최신 버전의 ComfyUI 및 커스텀 노드로 업데이트했는지 확인하세요.
** 5090/5080/5070 50xx 시리즈 Nvidia GPU 관련 문제 해결은 아래 고장 해결 섹션에 있습니다.
V6.6 I2V 네이티브 실행, Skyreels 삭제, 랜덤화 스택에 헬퍼 LoRA 추가. GGUF 저 VRAM 지원. 시스템 RAM을 VRAM으로 사용. 인터페이스 대폭 업데이트. 초보자에게는 완벽하고, 고급 사용자에게는 유연합니다. ComfyUI는 계속 업데이트되며 노드 크기 변경 등으로 기능을 깨뜨리고 있어 따라잡기 어렵습니다. 반드시 최신 버전의 ComfyUI 및 최신 커스텀 노드로 업데이트하세요.
V6에서 새롭게 추가된 기능! 대규모 개선. 인터페이스가 크게 변경되었습니다. LoRA 헬퍼를 포함한 이중 랜덤 LoRA 스택, 트리거/프롬프트 및 와일드카드. 밤새 생성 작업을 극대화하세요! 프롬프트 저장/불러오기 기능 추가. 얼굴 복원 기능. 오디오 생성 기능 개선, 단독 오디오 생성, T2V, I2V를 위한 SkyReels 지원, GGUF 지원, 시스템 RAM을 VRAM으로 사용 가능.
** Wan 2.1 베타 버전 출시: /model/1306165
자세한 내용은 아래 전체 설명서를 읽어주세요.
워크플로우 주요 기능:
오디오 생성 - MMaudio를 통해 - 비디오와 함께 오디오 렌더링, 단독 오디오 후처리용 플러그인 제공.
선택적 일시 정지 기능을 포함한 빠른 미리보기 생성
- 전체 길이 렌더링 전에 몇 초 안에 비디오 미리보기를 확인할 수 있습니다.
LoRA 랜덤라이저 - 12개의 LoRA로 구성된 2개의 스택을 랜덤화하고 조합할 수 있습니다. 와일드카드, 트리거 또는 프롬프트를 포함합니다. 랜덤 캐릭터 + 랜덤 동작/스타일을 상상하고 와일드카드를 추가하면 완벽한 밤샘 생성 시스템이 완성됩니다.
프롬프트 저장/불러오기/히스토리
다중 해상도
- 선택기를 통해 5개의 일반적인 해상도를 빠르게 선택할 수 있습니다. 최대 5개의 사용자 정의 해상도도 사용 가능합니다.
다중 업스케일 방법
표준 업스케일
보간 (프레임 속도 2배)
V2V 방법
다중 LoRA 옵션
표준 가중치를 사용하는 전통적 LoRA
더블 블록 (가중치를 신경 쓰지 않고 여러 LoRA를 결합할 때 더 나은 성능)
와일드카드 기능을 활용한 프롬프팅
Teacache 가속 (1.6 - 2.1배 속도 향상)
모든 옵션이 토글 및 스위치 형태로 구성되어 있어 노드를 수동으로 연결할 필요 없음
설정 방법에 대한 자세한 설명
얼굴 복원
텍스트 2 비디오, 비디오 2 비디오, 이미지 2 비디오
3090 GPU(24GB VRAM)에서 완전히 테스트됨
이 워크플로우는 초보자에게는 사용하기 쉬우면서도 고급 사용자에게는 유연하게 설계되었습니다.
이것은 제가 처음 만든 워크플로우입니다. 제가 개인적으로 비디오 생성을 위한 옵션을 원했기 때문에 이 시도를 해보았습니다.
추가 세부 정보:
저는 AI와 ComfyUI 초보자이며, 이는 제가 처음 만든 워크플로우입니다. "Hunyuan 2단계 T2V 및 업스케일" 워크플로우 - /model/1092466/hunyuan-2step-t2v-and-upscale 를 매우 좋아했고, 이를 기본으로 활용했습니다. 따라서 원래 워크플로우와 동일한 환경에서 작동합니다.
** 고장 해결 노드 또는 ComfyUI 관리자는 이 문서 하단에 있습니다.
빠른 시작 가이드:
기본 설정은 Hunyuan 2단계 T2V 및 업스케일 워크플로우에 맞춰 최적화되었습니다.
이 워크플로우의 단계는 다음과 같습니다.
0단계. 모델을 설정하세요. “모델 로드” 섹션에서 해상도 선택기에서 원하는 해상도를 선택하세요.
1단계. 저해상도 미리보기 모델을 렌더링하여 LoRA/모션 프롬프트가 제대로 작동하는지 확인하세요.
2단계. 미리보기를 확인하고, 전체 렌더링을 계속할지 여부를 결정하세요. (일시정지)
3단계. 저품질 렌더링을 입력으로 사용하여 중간 품질의 더 나은 렌더링을 생성합니다. 이 단계에서 선택한 해상도의 2배로 확장됩니다.
4단계. 프레임별 업스케일러를 사용하여 해상도를 다시 2배로 확장합니다.
5단계. 프레임 속도를 24fps에서 48fps로 두 배로 증가시켜 부드러운 움직임을 구현합니다.
(옵션 단계) MMaudio 생성 활성화 - 텍스트 프롬프트와 비디오를 기반으로 비디오에 적합한 음향을 생성합니다. 장면의 소리를 텍스트 프롬프트에 상세하게 기술하면 더 나은 생성 결과를 얻을 수 있습니다. 이 기능은 VRAM을 더 많이 사용하므로 기본적으로 비활성화되어 있습니다. 나중에 단독 MMaudio 플러그인을 사용해 오디오를 추가할 수 있습니다.
이제 단계 수, 비디오 길이, 해상도 등을 조정하여 사용 가능한 VRAM으로 최적의 균형을 찾을 수 있습니다.
모든 토글 및 스위치:
1단계에서 단 하나의 방법만 선택하세요.
* 이 설정은 기본값입니다.
이 워크플로우에서는 어떤 노드도 수동으로 재연결할 필요가 없습니다. 워크플로우 내부에 자세한 지침과 주석이 포함되어 있습니다.
V2V - 비디오에서 비디오로:
컨트롤 패널에서 활성화하세요:

비디오를 입력 또는 가이드로 사용할 수 있습니다. 컨트롤 패널에서 이 옵션을 활성화하고 소스 비디오를 업로드하세요. 이 옵션은 출력 해상도로 선택한 해상도를 사용합니다.
입력 비디오와의 유사도를 조정하려면 주 컨트롤 패널의 덴ois 값을 조정하세요. 낮은 값(0.5 - 0.75)은 입력 비디오와 더 유사한 결과를 제공하며, 높은 값은 더 창의적인 결과를 생성합니다.
I2V - 이미지에서 비디오로 (네이티브)
이 방법은 I2V를 위해 네이티브 Hunyuan을 사용합니다.

메인 컨트롤 패널에서 활성화한 후 아래에서 모델을 설정하세요:
I2V를 실행하기 전에 반드시 옵션 #3을 선택하세요.

로드 이미지 기능을 사용하여 소스 이미지를 불러오세요. 이미지는 이 플러그인이 깨지지 않도록 적절히 조정됩니다. 출력 해상도는 해상도 선택기에서 선택한 해상도를 따릅니다. I2V는 해상도에 매우 민감하므로, 해상도가 부적절하면 깜빡임이나 아티팩트가 발생합니다.
해상도 옵션은 두 가지입니다. 소스 해상도를 그대로 사용하려면 “원본 이미지 해상도 사용” 스라이더를 1로 설정하세요. 그러나 이는 자르지 않고 비율만 유지합니다. 두 번째 옵션은 기본 스케일(기본값 384)입니다. 비디오 엔진의 한계로 인해 원본 해상도로 매우 높은 해상도의 이미지를 렌더링하면 금방 메모리가 부족해집니다. 이 설정은 기본 스케일에 따라 렌더링 크기를 조정합니다. 시작 시 384-500 정도로 설정하고, VRAM이 처리 가능한지 확인하세요. 특히 소스 이미지가 매우 고해상도일 경우 그렇습니다. 낮은 해상도 사진으로 시작한다면 스라이더를 크게 올릴 수 있습니다.

I2V 방법 1: 한 번의 단계로 업스케일/보간/오디오 생성
이 방법을 사용하는 주요 방법은 메인 워크플로우에서 1a, 1b, 3을 비활성화하는 것입니다. 이는 이미지를 입력으로 받아 선택한 해상도로 비디오를 렌더링한 후, 스텝 4/5로 전달하여 업스케일링과 보간을 수행합니다. 아직 커뮤니티의 도움이 필요하며, 가장 잘 지원되는 I2V 해상도를 찾아야 합니다. 몇 가지를 시도해보세요.
비디오 확장:
I2V와 호환되는 해상도를 선택하세요 (Hunyuan의 호환 해상도 목록이 있다면 댓글로 공유해주세요). 이 방법은 첫 번째 프레임에 I2V를 사용합니다.
컨트롤 패널에서 1d, 2, 4, 5를 활성화하세요 (3은 건너뛰세요).
이 단계에서는 저해상도 또는 중간 해상도의 입력 소스를 사용하는 것이 매우 중요합니다. 그렇지 않으면 메모리가 부족해집니다. * I2V와 동일한 규칙 적용
T2V 2단계에서 중간 렌더링을 사용하거나 수동으로 저-중간 해상도를 비디오에 설정하세요. 수동으로 설정할 수 있습니다. 또는 원본 비디오 해상도를 사용할 수도 있습니다. 중간 소스 또는 T2V 2단계의 중간 렌더링을 사용한다면 이 방식은 완벽하게 작동합니다. 이 방법은 이를 위한 것입니다.
확장된 부분만 렌더링할 것인지, 전체 결합된 비디오를 렌더링할 것인지 선택하세요. 전체 결합된 비디오(원본 비디오 + 확장 비디오)를 원한다면 “True”를 선택하세요. 이 경우 전체 결합된 비디오가 다음 업스케일러 단계로 전달됩니다. 따라서 중간 수준의 비디오를 사용하는 것이 중요합니다. 이는 다시 업스케일링 및 보간을 수행하기 때문입니다.
1단계 - 선택한 단계와 해상도로 1회 완전 렌더링을 수행합니다.
일시정지 후, 업스케일러로 계속할지, 취소하고 다시 시도할지 판단합니다.
업스케일링 - 중간 렌더링을 입력으로 받아 해상도를 2배로 확장합니다.
보간 - 프레임 속도를 2배로 증가시킵니다.
모델 선택 (저 VRAM 옵션):
저는 24GB VRAM 환경에서 테스트했지만, 많은 사용자들이 저 VRAM 환경을 위한 도움을 요청했습니다. 저 VRAM 환경에서는 테스트하지 않았지만, 아래 기능들이 도움이 되길 바랍니다.
스탠다드 BF16/FP8 또는 FP8 모델을 "1. 표준 디퓨전 모델 로드"에 로드하세요.
GGUF 모델을 "2. GGUF 모델 로드 (멀티 GPU/시스템 RAM을 VRAM으로 사용)"에 로드하세요.
제가 이해하기로는, GGUF 모델은 약간 더 오래 걸릴 수 있지만, 선택한 모델에 따라 VRAM을 크게 절약할 수 있습니다.
녹색 선택 상자를 사용하여 워크플로우에서 사용할 모델을 선택하세요.
VRAM 절약을 위해 DualCLIP 로더의 "device"를 CPU로 설정하세요. 옵션이 보이지 않는다면, 우클릭하여 "고급 보기"를 선택하면 나타납니다.
GGUF 모델을 사용하는 경우, "use_other_vram"을 "true"로 설정하세요. 이렇게 하면 시스템 RAM을 VRAM으로 사용할 수 있어 OOM 오류를 방지할 수 있습니다. 위에 설정된 가상 VRAM 양을 사용할 수 있습니다. 시스템 RAM을 사용할 경우 렌더링 속도가 훨씬 느려지지만, 적어도 작업이 중단되지 않습니다.
** 또한 24GB 크기의 GGUF 모델이 있다는 것을 알게 되었습니다. 이 모델이 BF16 모델과 동일한 품질을 갖는지 아시는 분 계신가요? 품질을 포기하고 싶지 않지만, 가상 VRAM 기능을 사용하고 싶습니다. 알려주시면 감사하겠습니다.
LoRA 옵션:
전통적 LoRA와 더블 블록을 모두 사용할 수 있으며, 기본값은 더블 블록입니다.
더블 블록은 여러 LoRA를 결합할 때 가중치를 자주 조정할 필요 없이 더 나은 성능을 제공하는 것으로 보입니다.
메인 LoRA 스택은 표준 덧셈 LoRA 트리입니다. 최대 5개의 서로 다른 LoRA를 추가하거나 결합할 수 있으며, 사용하는 LoRA에 따라 all, single_blocks, double_blocks를 설정하세요. 이 LoRA들은 랜덤 LoRA와 함께 사용할 수 있습니다. 메인 LoRA 섹션에 스타일을 추가한 후, 랜덤 캐릭터 LoRA와 랜덤 캐릭터 애니메이션을 추가하세요.
LoRA를 활성화/비활성화하려면 우클릭하고 "Bypass"를 선택하세요.
해상도 옵션:
5개의 일반적인 해상도 중 하나를 선택하거나, 추가로 5개의 사용자 정의 해상도를 설정하여 개인화하세요. "해상도 선택기"로 해상도를 변경하세요. 기본값으로 가장 빠르고 작은 해상도가 선택되어 다음 V2V 단계에 사용되도록 설계되었습니다. 해상도가 커질수록 렌더링 시간이 훨씬 길어집니다.
미리보기 후 일시정지 (기본값: 활성화됨)
비디오 생성에는 시간이 오래 걸리며, 여러 LoRA를 실험하거나 프롬프트를 정확히 맞추는 데도 오랜 시간이 걸립니다. 업스케일 단계를 거치기 전에 빠르게 비디오를 미리보기할 수 있도록 이 기능을 제공합니다. 기본값으로 이 기능이 활성화되어 있습니다. 워크플로우를 시작하면 빠른 미리보기가 렌더링되고, 그 후 종소리가 울립니다. 다음 단계를 위해 비디오 미리보기 옆 중간 섹션으로 스크롤하세요.
좋은 미리보기를 업스케일하거나, 취소하고 다시 시도하세요!
전체 렌더링/워크플로우 계속 - 임의의 이미지 하나를 선택(어떤 이미지든 상관 없음)하고 "선택한 이미지 진행"을 클릭하세요.
취소 - "현재 실행 취소"를 클릭한 후, 새로운 미리보기를 대기열에 추가하세요.
이 기능을 비활성화하려면 "옵션 선택기"에서 끄세요.
MMaudio - 비디오에 자동으로 오디오 추가
기본적으로 이 기능은 업스케일링된 비디오에만 오디오를 추가합니다. 그러나 렌더링 프로세스의 모든 부분에 대해 이를 활성화할 수 있는 전환 옵션이 있습니다. 더 나은 생성을 위해 오디오 세부 정보를 프롬프트에 포함하세요.
**참고: MMaudio는 추가 VRAM을 사용합니다. MMaudio를 사용할 때는 비디오 길이와 품질을 조절해야 할 수 있습니다. v5.2 버전에서 별도 플러그인이 제공되며, 주요 워크플로우에서 비디오를 완성한 후 오디오를 추가할 수 있습니다. 이를 통해 VRAM에 맞춰 품질과 비디오 길이를 극대화한 후, 후처리 단계에서 오디오를 추가 단계로 간단히 추가할 수 있습니다. 별도 플러그인을 사용하면 비디오에 완벽한 오디오를 얻기 위해 여러 번 생성할 수 있는 추가 유연성을 제공합니다.
업스케일링 후 보간
이 옵션은 렌더링된 비디오의 프레임 속도를 두 배로 늘릴 수 있습니다. 기본값은 "사용"입니다.
"옵션 선택기"에서 이 기능을 비활성화할 수 있습니다. 필요 없는 경우 렌더 속도가 느려질 수 있습니다.
나는 속도가 필요하다, 속도가!
작업이 너무 느리게 실행되고 있나요? 최소한의 품질을 희생하면서 Teacache 속도를 최대 2.1배까지 높일 수 있습니다. 기본값은 빠름(1.6배)입니다. Teacache 샘플러 노드가 2개 있다는 점에 유의하세요.
T2V - 텍스트에서 비디오로 - 프롬프트 및 와일드카드
프롬프트는 녹색 "프롬프트 입력" 노드에 입력하세요. *** 프롬프트에 줄바꿈이나 새 줄이 포함되지 않도록 하세요. 그렇지 않으면 시스템이 워크플로우를 처리하는 방식이 변경됩니다.
와일드카드는 프롬프트를 자동으로 변경하거나 밤새 생성을 다양한 변형으로 실행할 수 있는 기능입니다. 와일드카드를 생성하려면 /custom_nodes/ComfyUI-Easy-Use/wildcards 폴더에 .txt 파일을 생성하세요. 각 줄에 하나의 와일드카드를 입력하고, 각 와일드카드 사이에 엔터 키를 눌러 구분하세요. 단어나 문구를 사용할 수 있으며, 단지 "엔터"로 구분만 되면 됩니다. 공백을 두 번 사용하지 마세요. 아래는 와일드카드 파일 예시입니다.
color.txt
red
blue
green
locations.txt
아름다운 푸른 숲, 햇빛이 나무 사이로 비쳐 들어와 조명을 흩어뜨리며 미세한 신성한 빛줄기가 생기고, 배경에서 나뭇잎이 스르륵 움직이는 소리가 들린다
야간 도시 풍경, 비가 내리고 있으며 가까운 지붕 위로 빗방울이 떨어지는 소리가 들린다
숲 속의 환경, 바위 절벽 가장자리에 작은 아름다운 폭포가 있고, 작은 연못과 푸른 나무들이 있으며, 폭포 소리는 멀리서 들리고 배경에서는 새들이 지저귄다
이 와일드카드를 프롬프트에 사용하려면 "와일드카드 추가 선택"을 클릭하여 프롬프트의 적절한 위치에 추가하세요.
ellapurn3ll은 __color__ 재킷을 입고 있으며, __locations__에 있다.
이 커스텀 노드에 대한 전체 세부 정보는 다음 링크에서 확인할 수 있습니다: https://github.com/ltdrdata/ComfyUI-extension-tutorials/blob/Main/ComfyUI-Impact-Pack/tutorial/ImpactWildcard.md
랜덤 Lora 및 트리거
와일드카드와 랜덤 Lora를 함께 사용하여 밤새 생성을 더욱 향상시키세요.
최대 12개의 랜덤 Lora를 선택하여 조합할 수 있습니다. 기본값으로는 상위 5개만 활성화되어 있습니다. 설정에서 "최대 개수"를 변경하여 구성한 Lora의 개수를 조정하세요. 시스템은 항상 위에서 아래로 순서를 카운트합니다. 따라서 3개의 Lora만 랜덤화하려면 "최대"를 3으로 설정하고 상위 3개의 Lora 정보만 입력하세요.
매우 중요: 트리거 단어가 자동으로 채워지도록 하려면 프롬프트 필드에 다음 텍스트를 포함해야 합니다:
(LORA-TRIGGER) 또는 (LORA-TRIGGER2). 이는 랜덤 Lora로 생성할 때 자동으로 값을 채워줍니다. 대소문자를 구분하므로 주의하세요.
전체 프롬프트, 단일 트리거, 또는 트리거 문구를 모두 입력할 수 있으며 자동으로 채워집니다.
이 기능에 와일드카드를 추가하려면 {} 괄호와 | 구분자를 사용하세요. 예: 그녀는 {빨간색|녹색|파란색} 모자를 쓰고 있다. 또는 전체 프롬프트도 가능합니다: {그녀는 타임스퀘어에 서서 키스를 날리고 있다|그녀는 공원에 앉아 키스를 날리고 있다}
ヘル퍼 Lora는 랜덤 Lora 스택 2에서만 사용 가능합니다.
헬퍼 Lora가 이제 제공됩니다. 일부 Lora는 모션 또는 스타일 Lora와 함께 사용할 때 더 나은 결과를 제공합니다. 헬퍼 Lora를 활성화하면 랜덤 스택 2에서만 적용되며, 랜덤화 과정에서 해당 Lora 번호가 선택된 경우에만 작동합니다. 예: Lora 1이 모션 또는 스타일 Lora와 함께 사용할 때 더 나은 결과를 내는 경우, Lora 1 헬퍼를 활성화하고 랜덤화 과정에서 Lora 1이 선택되면 기본 Lora와 헬퍼 Lora 둘 다 적용됩니다.
이 기능은 주로 고급 사용자를 위한 것이지만 일부 사용자에게 유용할 수 있습니다.
"프롬프트 저장소"로 좋아하는 프롬프트를 로드하고 저장하세요
워크플로우를 실행하면 프롬프트 저장소에 최신 프롬프트가 자동으로 채워집니다. 나중에 사용하기 위해 저장할 수 있습니다. 프롬프트를 로드하고 사용하려면 이전에 저장한 프롬프트를 선택하고 "로드된 프롬프트 로드"를 클릭하세요. 그러나 로드한 프롬프트를 사용하려면 반드시 "입력 사용"을 "프롬프트 사용"으로 전환해야 합니다. 일반적인 프롬프트 사용으로 돌아갈 때는 다시 "입력 사용"으로 전환하는 것을 잊지 마세요.

기본값은 "입력 사용"입니다. 이는 프롬프트가 일반 입력 와일드카드 필드에 의해 생성되며, 프롬프트 저장소에는 단지 프롬프트 데이터가 표시됩니다.
하나의 시드가 모두를 지배한다:
하나의 단일 시드가 모든 Lora 랜덤화, 와일드카드 및 생성을 처리합니다. 랜덤 Lora와 와일드카드를 사용하여 동일한 세트로 좋아하는 시드를 복사하여 반복 사용할 수 있습니다.
* 팁: 재사용 버튼을 클릭하여 마지막 시드를 재사용하세요. 방금 생성한 비디오를 미세 조정하거나 수정하고 싶으신가요? 2단계에서 OOM 오류가 발생했나요? 이전 시드를 사용하고 조정한 후 다시 시도하세요!
별도 MM-Audio:
품질과 비디오 길이를 극대화하려면 주 워크플로우에서 MM-audio를 비활성화하고 후처리 단계에서 나중에 오디오를 추가하는 것이 좋습니다. 이 플러그인은 나중에 오디오를 추가하기 위해 별도로 실행되도록 설계되었습니다.
MMAudio - 별도 사용을 활성화하고 워크플로우의 다른 모든 부분을 비활성화하세요.
오디오를 추가할 비디오를 단순히 업로드하세요. 모든 연산은 자동으로 처리됩니다. 빈/공백 프롬프트를 사용하는 것이 권장되지만, 이전에 저장한 프롬프트를 로드하려면 프롬프트 저장소를 사용할 수 있습니다.
(선택 사항) 오디오와 관련된 장면이나 소리에 집중하여 프롬프트를 개선할 수 있습니다.
원하는 만큼 여러 번 생성하여 완벽한 음향을 얻으세요!
별도 업스케일러 및 보간:
기존 비디오 파일을 단순히 업스케일링하거나 보간하고 싶으신가요? 비디오를 업로드하고, 업스케일러와 보간을 제외한 워크플로우의 모든 부분을 비활성화하세요.
업로드 박스는 적절한 위치에서 활성화되어야 합니다.
"예"로 설정하여 이 기능을 사용하세요. 일반 워크플로우를 사용할 때는 반드시 이 기능을 끄는 것을 잊지 마세요. 기본값으로 이 두 기능은 모두 비활성화되어 있습니다.
워크플로우 사용 팁
빠른, V2V 방법, Lora (기본값) - 원래 워크플로우를 따릅니다.
빠른 저해상도 비디오를 사용한 빠른 미리보기: 사용
가로 비디오의 경우 (해상도 1 - 368x208)
세로 비디오의 경우 (해상도 3 - 320x416)
전체 렌더링을 할지 여부를 결정하기 위해 잠시 정지
전체 렌더링에는 오디오, 업스케일링 및 보간이 포함됩니다
T2V를 직접 업스케일링하는 방법
중간 또는 고해상도로 렌더링한 후 업스케일러 및 오디오를 사용
고해상도를 위해 해상도 2, 4, 5 옵션 사용 - 렌더링 속도가 느려집니다. 저는 개인적으로 대부분의 생성에 해상도 4를 사용합니다
업스케일링 및 오디오 추가
설정
"옵션" 메뉴에서 "중간 V2V"를 비활성화하세요
업스케일러 선택에 입력 2를 선택하세요
메인 창의 BetaSamplingScheduler에서 "단계"를 25 이상으로 증가시키세요

생성 품질 향상
단계 수 증가:
기본 V2V 방법의 경우, 컨트롤 패널(설정)에서 단계를 24에서 35 이상(최대 50)으로 증가시키세요. 각 단계는 더 많은 시간과 메모리를 소모하므로 해상도와 단계 사이의 균형을 찾으세요.

메인 렌더 비디오 미리보기 또는 중간 단계를 우회하는 경우, 단계를 12에서 훨씬 더 높은 수치(예: 30/35)로 증가시키세요

최고 품질을 원한다면 35단계 이상을 실행하고, Teacache 노드(메인/중간)를 "빠름 1.6"이 아닌 "원본 1X"로 줄이세요
더 높은 해상도 시도:
해상도를 큰 해상도(예: 해상도 2 또는 4)로 변경한 후 대기열에 추가하세요. 대부분의 경우 동일한 비디오를 더 높은 해상도로 얻을 수 있습니다. 기본적으로 큰 해상도는 작은 해상도의 2배이며, 이 방법을 사용할 때 일관성을 유지하는 데 도움이 됩니다. 항상 동일한 종횡비를 사용하세요(예: 1→2, 3→4)
완벽한 비디오를 위해 비디오 길이와 품질을 균형 있게 조정하세요
아래는 3090 24GB VRAM에서 테스트한 비디오 길이와 품질의 균형을 맞추기 위해 사용한 설정입니다.
가장 긴 비디오 길이(16:9):
해상도 1 사용, 비디오 길이 201 프레임, 기본 스케줄러에서 I2V 중간 단계를 "23" 또는 "24"로 설정, 스케줄러를 "beta"로 설정. MM-audio 비활성화, 업스케일러 및 보간 사용.
더 긴 비디오의 경우, 메인 비디오 렌더링 단계를 15로 설정하는 것이 더 나은 제어를 위해 권장됩니다.
** 팁: 201 프레임은 Hunyuan 비디오의 최대 크기이며, 이 길이에서 완벽한 루프를 생성하는 경우가 많습니다.
고품질(16:9)(3:4):
해상도 1 또는 3 사용, 비디오 길이 97 프레임, 메인 비디오 렌더링 BetaSamplingScheduler 단계를 "15"로 설정, 기본 스케줄러에서 I2V 중간 단계를 "35"로 설정, 스케줄러를 "beta"로 설정. MM-audio 비활성화, 업스케일러 및 보간 사용.
오디오 포함 균형(16:9, 3:4):
해상도 1 또는 3 사용, 비디오 길이 73 또는 97 프레임, 기본 스케줄러에서 I2V 중간 단계를 "28"로 설정, 스케줄러를 "beta"로 설정. MM-audio 활성화, 업스케일러 및 보간 사용.
문제 해결:
5090/5080/5070 50xx 시리즈 Nvidia GPU 해결법
50xx Nvidia GPU는 여전히 개발 중입니다. 여기에는 Python 3.12.X과 함께 제공되는 표준 ComfyUI 포터블 버전을 사용할 때 몇 가지 팁을 제공합니다.
최근에 GPU를 Nvidia 50xx로 업데이트했는데 아무것도 작동하지 않나요?!
아래는 3090 24GB VRAM에서 테스트한 비디오 길이와 품질의 균형을 맞추기 위해 사용한 설정입니다.
표준 ComfyUI 포터블 버전을 다운로드하거나 기존 폴더를 사용하세요.
CUDA 12.8 설치
(Torch 2.7 개발 버전 설치)
python_embedded 폴더로 이동
python.exe -s -m pip install --force-reinstall torch==2.7.0.dev20250307+cu128 torchvision==0.22.0.dev20250308+cu128 torchaudio==2.6.0.dev20250308+cu128 --index-url https://download.pytorch.org/whl/nightly/cu128 --extra-index-url https://download.pytorch.org/whl/nightly/cu128
(Triton 3.3 프리릴리즈)
python.exe -m pip install -U --pre triton-windows
python.exe -m pip install sageattention==1.0.6
(Sage Attention)
SET CUDA_HOME=C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8
cd sageattention
..\python.exe setup.py install
위 방법이 작동하지 않는 경우, 이 기사를 참고하여
setup.py파일을 다음 링크의 코드로 교체하세요. https://github.com/thu-ml/SageAttention/issues/107
이제 정상적으로 작업을 실행할 수 있어야 합니다. 일부 이전에 작동하던 노드들이 이유를 알 수 없이 작동하지 않게 되었습니다. 곧 5090, 5080, 5070 시리즈 카드에 대한 수정 사항을 두 작업 흐름 모두에 포함시켜 업데이트하겠습니다.
참고: 저는 이 분야의 전문가가 아닙니다. 제 시스템에서 이를 작동시킨 방법을 공유할 뿐, 문제 해결을 도와드릴 수 없습니다.
모델 로딩 또는 누락 문제:
이 작업 흐름은 녹색 및 보라색 모델 각각 하나를 다운로드하여 설정하고 할당했음을 가정합니다. T2V, V2V의 경우 낮은 VRAM을 위해 #1 또는 #2 GGUF를 선택하세요. I2V의 경우 #3을 선택해야 합니다. 이 모든 모델이 정의되어 있는지 확인하세요. 예를 들어 GGUF를 사용하지 않는 경우, 2번 상자를 우클릭하여 '우회(Bypass)'를 선택하면 작업 흐름이 누락된 모델에 대해 경고하지 않습니다.

노드 누락:
MMaudio – 오디오 노드가 로드되지 않는 경우, ComfyUI Manager에 접속하여 다음 주소로 "Git URL을 통한 설치"를 수행하세요: https://github.com/kijai/ComfyUI-MMAudio
그 후 재시작하세요.
보안 오류가 발생하면, ComfyUI/user/default/ComfyUI-Manager 폴더로 이동하여 config.ini 파일을 메모장으로 열고 "security_level = normal"을 찾아 "security_level = weak"로 변경하세요. 그런 후 설치를 시도하세요. 설치가 완료되면 이 설정을 다시 "normal"로 되돌릴 수 있습니다. 추가적인 MMaudio 정보는 해당 GitHub 페이지에서 확인할 수 있습니다.
UnetLoaderGGUFDisTorchMultiGPU 누락됨: ComfyUI Manager에서 "ComfyUI-MultiGPU"를 검색하세요.
또한 ComfyUI에 "ComfyUI-GGUF"가 설치되어 있어야 합니다. 이 두 확장 프로그램이 모두 ComfyUI Manager를 통해 검색되고 로드되었는지 확인하세요.
위 방법이 작동하지 않으면, ComfyUI Manager에서 "Git URL을 통한 설치"를 통해 다음 주소를 입력해 보세요: https://github.com/pollockjj/ComfyUI-MultiGPU
보안 오류가 발생하면, ComfyUI/user/default/ComfyUI-Manager 폴더로 이동하여 config.ini 파일을 메모장으로 열고 "security_level = normal"을 "security_level = weak"로 변경한 후 ComfyUI Manager에서 설치를 시도하세요.
마지막 수단으로 MultiGPU를 완전히 비활성화하려는 경우(추천하지 않음): "모델 로딩" 섹션으로 이동하여 녹색 선택기 스위치 "Diffusion Model"이 1로 설정되어 있는지 확인한 후, "2. Load Model GGUF(multiGPU/System Ram as VRAM)" 노드를 삭제하세요. 이 경우 모든 기능이 정상 작동하나, GGUF와 그 VRAM 최적화 기능을 사용할 수 없게 됩니다.
이 노드를 삭제하세요.
ReActor 또는 Face Enhanced 노드 누락:
Re-Actor 노드에 문제가 생긴 경우, 쉽게 제거할 수 있습니다. 이론적으로 이 노드는 기본적으로 우회되어 있으므로 작업 흐름은 이를 제외하고도 작동합니다.
빨간색 "Restore Faces" 상자로 이동하여 회색 영역 어디든 더블 클릭하고, "reroute"를 검색하여 노드를 추가하세요.
Restore Faces의 왼쪽 입력 줄을 새 노드의 왼쪽으로 드래그하세요.
reroute 노드의 오른쪽에서 "Upscale Video"의 이미지 입력으로 새로운 줄을 드래그한 후, Restore Faces 노드를 완전히 삭제하세요.

이상입니다. 모든 원작자분들에게 감사드립니다.
즐겁게 사용하시길 바랍니다. 이렇게 열려 있고 공유하는 커뮤니티에 참여할 수 있어 정말 좋습니다!
자신의 생성물과 설정을 이 작업 흐름과 자유롭게 공유해 주세요.
