Daxamur's WAN 2.2 Workflows v1.2.1 (FLF2V | T2V | I2V | GGUF | Easy Bypass | Experimental True Endless Generation)

세부 정보

모델 설명

Daxamur's Wan 2.2 워크플로우

제 일을 지원하고 싶다면, 제 Patreon을 확인하세요!
맞춤 프로젝트 문의는 DM으로.


-뉴스-

다음 릴리스를 준비하는 데 집중하고 있어 응답이 지연되고 있습니다. 릴리스 후에는 응답이 정상으로 복귀됩니다!

v1.2.1 출시! - DaxNodes를 ComfyUI 매니저를 통해 업데이트해야 합니다

  • GGUF 지원이 추가된 FLF2V 노드 도입 - 새 모델은 불필요

  • 업스케일링과 보간을 독립적으로 비활성화/활성화할 수 있는 기능 수정

  • 전용 해상도 선택 노드 추가, v1.3.1부터 I2V 및 FLF2V에 자동 크기 조정 기능 적용

DaxNodes가 이제 ComfyUI 매니저를 통해 사용 가능! git clone 필요 없음!


현재 추적 중인 버그:

  • 일부 사용자에서 KJNodes Get/Set이 누락된 오류를 보고합니다. 이 문제가 발생하면 ComfyUI 매니저에서 최신 버전의 DaxNodes를 다운로드하고 워크플로우를 다시 불러와야 합니다! - 진행 중

VideoSave 또는 기타 비디오 관련 노드에서 "FileNotFoundError ([WinError 2] 지정된 파일을 찾을 수 없습니다.)" 오류가 발생하면 FFmpeg이 설치되지 않았거나 시스템 PATH에 포함되지 않았습니다.

  • 설정 (전체 버전 필요):

  • 전체 FFmpeg 빌드 다운로드

  • 안정적인 위치에 압축 해제 (예: C:\ffmpeg)

  • C:\ffmpeg\bin을 시스템 PATH에 추가:

  • 시스템 환경 변수 편집 → 환경 변수...

  • 시스템 변수 아래에서 Path를 선택 → 편집...

  • 새로 만들기를 클릭하고 C:\ffmpeg\bin을 추가

  • 저장하고 종료

ComfyUI를 재시작하세요 (터미널/명령 프롬프트도 재시작).

이후 모든 기능이 정상 작동합니다!


v1.3.1 기능

세그먼트 기반 프롬프팅

  • 지속적인 긍정 프롬프트: 전체 비디오에 걸쳐 일관된 세부 정보 유지 (예: “녹색 눈과 갈색 머리의 여성이 따뜻하게 조명된 침실에 있다”)

  • 세그먼트 긍정 프롬프트: +로 구분, 각 세그먼트 길이마다 하나씩 (예: “그녀는 일기를 쓴다 + 일기를 닫고 일어선다 + 그녀는 멀리 걸어간다”)

  • 장문 비디오에서 훨씬 더 정밀한 제어 가능하며, I2V 시작 시 WAN의 이상한 카메라 움직임이나 점프 현상을 줄이는 데 도움

끝없는 루프 스타일

  • 세그먼트를 무한히 연결 가능 (노드는 9999로 제한함) - 실질적으로 무한 루프 생성

  • 비디오 실행 ID가 덮어쓰기 및 합성 관리 - 새로운 시퀀스를 생성할 때마다 ID를 증가시키기만 하면 됨

스트리밍 RIFE VFI + 업스케일링

  • RIFE VFI 및 업스케일링 개선: 전체 시퀀스를 VRAM/RAM에 보관하지 않고 프레임을 스트리밍

  • 훨씬 더 긴 비디오, 부드러운 보간, OOM 오류 없이 선명한 업스케일링 가능

얼굴 검출 및 드리프트 보정

  • 지능형 Mediapipe 얼굴 프레임 감지로 캐릭터에 초점 고정

  • 드리프트 보정으로 최종 비디오가 지정된 길이 이상으로 실행됨 - 중간에 생성을 자르지 않고, 대신 목표 프레임 수에 도달하거나 초과할 때까지 완전한 추가 세그먼트를 삽입

  • 이렇게 하면 생성된 프레임이 낭비되지 않으며, 항상 부드럽고 완전한 세그먼트를 얻을 수 있음

  • 완전히 전환 가능하며 프레임 백워드 설정 조정 가능

해상도 처리

  • T2V: 표준 WAN 해상도 프리셋, 선택적 오버라이드 지원

  • I2V: 입력 이미지가 WAN 네이티브 해상도로 비율을 유지하며 스케일링. “네이티브” 패스스루 지원

QoL 및 관리

  • 업스케일링/보간을 독립적으로 전환 가능

  • 실행 ID별 임시 파일 출력 정리 - 공간 절약을 위해 **/output/.tmp/**를 주기적으로 지움

향후 계획

이 워크플로우는 여전히 실험 단계입니다. 향후 버전에서는 세그먼트 제어 강화, 움직임/카메라 동작의 지능형 처리, 더 적응적인 얼굴 추적, 그리고 영화적 시퀀스를 위한 오디오/비디오 통합이 추가될 예정입니다. 큰 변화가 다가옵니다!


참고 사항

구성하고자 하는 대부분의 노드는 흐름의 하단부(대략 순차적으로)에 배치했으며, 운영/백엔드 관련 내용은 상단에 위치시켰습니다. 각 노드는 기능을 명확하게 설명하는 라벨이 붙어 있습니다.

그 외에;

  • NAG 어텐션이 사용 중이므로 CFG를 기본값 1로 유지하는 것이 좋습니다.

  • 샘플러 및 스케줄러는 기본적으로 uni_pc // simple로 설정되어 있으며, 이는 속도와 품질의 최적 균형을 제공합니다. (1.1> 전용) 조금 더 오래 기다리는 것을 감수하고 약간 더 나은 결과를 원한다면, RES4LYF 커스텀 노드의 res_3s // bong_tangent를 추천합니다.

  • 기본 단계 수를 4가 아닌 8(샘플러당 4단계)로 설정했습니다. 이는 품질 대비 시간의 가장 큰 트레이드오프 지점이기 때문입니다. 그러나 이는 최종적으로 사용자 선호에 따라 조정 가능합니다.

  • 이 워크플로우는 기본적으로 완성된 비디오를 ComfyUI/output/WAN/<T2V|T2I|I2V>/에 저장합니다.

I2V

  • 커스텀 노드 flow2-wan-video는 Wan 이미지에서 비디오로 변환 노드와 충돌하므로 제거해야 작동합니다. ComfyUI 매니저를 통해 제거해도 이 노드가 custom_nodes 폴더에서 완전히 삭제되지 않는 경우가 있어 수동으로 삭제해야 합니다.

GGUF

  • GGUF 버전 워크플로우에서 사용하는 모든 모델은 베이스 고/저 노이즈 모델을 제외하고 동일합니다. 시스템에 가장 적합한 GGUF 양자화를 선택하고, 각 Load WAN 2.2 GGUF 노드에 맞는 모델을 설정해야 합니다. 일반적으로 GGUF 모델은 VRAM에 여유가 약간 남도록 적절한 크기로 선택하세요.

  • GGUF 워크플로우의 예제는 WAN 2.2 I2V 및 T2V의 Q6_K 양자화를 사용해 생성되었습니다.

  • 이 워크플로우에서 테스트한 WAN 2.2 GGUF 양자화 모델은 허깅페이스의 다음 위치에서 제공됩니다;

MMAUDIO

  • MMAUDIO를 설정하려면 아래 MMAUDIO 모델을 다운로드하고, 모델 디렉토리(ComfyUI/models/mmaudio)에 “mmaudio” 폴더를 생성한 후, 다운로드한 모든 mmaudio 모델(심지어 apple_DFN5B-CLIP-ViT-H-14-384_fp16.safetensors 포함)을 이 폴더에 넣어야 합니다.

블록 스왑 워크플로우

  • 네이티브 ComfyUI 메모리 스왑이 테스트에서 더 많은 메모리를 절약하고 처리 속도를 덜 늦추는 것으로 확인되어 discontinued되었습니다. 기본 v1.2 워크플로우에서 OOM 오류가 발생하면 GGUF 버전을 시도해 보세요!

Triton 및 SageAttention 문제

  • 사용자들이 가장 자주 겪는 문제는 Triton 및 SageAttention 설치와 관련된 것입니다. 저는 최선을 다해 도와드리고 있지만, 혼자서는 모든 사용자의 요청을 적절한 시간 내에 처리할 수 없습니다. 다행히 @CRAZYAI4U가 Stability Matrix를 제게 추천해 주셨고, 이 도구는 ComfyUI를 자동으로 배포하고 Triton 및 SageAttention 설치를 위한 전용 스크립트를 제공합니다.

  • 먼저 이 저장소에서 Stability Matrix를 다운로드하고, 허브를 통해 ComfyUI를 다운로드하세요. ComfyUI가 허브를 통해 배포된 후, ComfyUI 인스턴스 항목의 왼쪽 상단 세로 세 점을 클릭하고 "Package Commands" → "Install Triton and SageAttention"을 선택하세요. 완료되면 워크플로우를 임포트하고, ComfyUI 매니저를 통해 누락된 종속성 설치, 모델 삽입 후 생성을 시작할 수 있습니다!

  • 곧 이 과정을 스크린샷과 함께 전용 기사로 정리할 예정입니다.

사용된 모델

T2V (텍스트 → 비디오)

I2V (이미지 → 비디오)

MMAUDIO

비네이티브 커스텀 노드 사용

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.