Wan 2.2 - I2V - XT-404 - Master UI
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
저의 개인적인 워크플로우일 뿐, 모델이나 노드를 만든 책임은 없습니다!!!
설명 아래의 노드와 모델을 사용하세요!!!
노드 > https://github.com/XT-404/XT-404_SKYNET
Lora Loader https://github.com/HenkDz/rgthree-comfy
모델 > https://civarchive.com/models/2244942?modelVersionId=2527274
🤖 XT-404 Skynet Suite: Wan 2.2 통합
ComfyUI용 "Omega Edition"
XT-404 Skynet Suite는 ComfyUI용으로 특별히 설계된 고도로 전문화되고 검증된 커스텀 노드 모음으로, Wan 2.1 및 2.2 비디오 확산 모델에 최적화되었습니다.
표준 노드와 달리, 이 스위트는 "시각적 우월성"을 목표로 합니다—수학적 정밀도로 8K, OLED 등급의 품질을 달성합니다. 일반적인 처리를 버리고, 신호 무결성을 보호하고, VRAM을 정밀하게 관리하며 디지털 아티팩트를 제거하는 휴리스틱 및 컨텍스트 인식 알고리즘을 사용합니다.
⚠️ 요구 사항
ComfyUI: 최신 버전을 권장합니다.
Wan 2.2 모델: VAE, CLIP, UNet/Transformer 모델을 확보하세요.
Python: 3.10+
FFmpeg: Compressor 노드에 필요합니다(일반적으로
imageio-ffmpeg를 통해).
경고
INFILTRATION PROTOCOL (GGUF): Cyberdyne Model Hub와 GGUF 양자화 모델을 사용하려면 ComfyUI-GGUF 엔진이 필수입니다. 📥 엔진 다운로드: city96/ComfyUI-GGUF 이 엔진 없이 Cyberdyne Model Hub는 Safetensors 전용 모드로만 작동합니다.
🚀 주요 기능
제로 포인트 노이즈 주입: 비디오 생성에서 정적 "눈사태"를 제거합니다.
ARRI 롤오프 톤 매핑: 고대비 장면에서도 흰색 클리핑을 방지합니다.
나노 리페어(Genisys): TF32 정밀도로 인한 검은 화면/NaN을 방지하기 위한 실시간 텐서 모니터링.
OLED/8K 워크플로우: 깊은 검정, 유기적 그레인, 마이크로 디테일 환상에 특화된 전용 파이프라인.
센티넬 텔레메트리: 실시간 콘솔 로그("The Mouchard")가 단계별로 채도, 클리핑 및 VRAM 사용량을 분석합니다.
📦 설치
ComfyUI 사용자 정의 노드 디렉토리로 이동하세요:
cd ComfyUI/custom_nodes/
이 저장소를 클론하세요:
git clone https://github.com/YourUsername/XT-404-Skynet-Suite.git
필요한 패키지를 설치하세요:
pip install imageio-ffmpeg scikit-image
🛠️ 모듈 분해
1. 코어 엔진 (XT404_Skynet_Nodes.py)
생성 과정의 핵심입니다. 표준 KSamplers를 Wan의 Flow Matching에 최적화된 하이브리드 엔진으로 대체합니다.
제로 포인트 수정:
0 + 노이즈 = 순수 노이즈를 보장하여 주입 전 잠재 공간을 초기화합니다.Wan 시그마 계산기: Wan 2.1/2.2에 필요한 특정 시프트 공식을 사용합니다.
체인 아키텍처: 마스터 시그마 클록을 노드 간에 전달하여 "Hires Fix"를 지원합니다.
2. 유니버설 로더 (cyberdyne_model_hub.py)
체크포인트, SafeTensors 및 GGUF 모델을 위한 통합 로더입니다.
재귀적 검색: 하위 디렉토리에서 모델을 자동으로 찾습니다.
GGUF 위임: GGUF 파일을 감지하여 적절한 백엔드로 라우팅합니다.
스마트 오프로드: 사용하지 않는 모델을 RAM으로 적극적으로 오프로드하여 샘플러를 위한 VRAM을 확보합니다.
3. 비주얼 우월성 스위트 (wan_visual_supremacy.py)
"AI 플라스틱 룩"을 치유하는 "비밀 소스"입니다.
잠재 디테일러 X: 디코딩 전 마이크로 디테일을 주입하면서 신호 포화를 방지합니다.
템포럴 잠금 프로: 디코딩 후 안정화기로, 낮은 델타 프레임을 블렌딩하여 깜빡임을 제거합니다.
OLED 다이내믹스(ARRI 롤오프): 하이라이트 텍스처를 보존하는 로그리듬 압축 곡선입니다.
4. 나노 리페어 시스템 (wan_genisys.py)
노드:
Cyberdyne Genisys [OMNISCIENT]기능: TF32/BF16에서 발생하는 "검은 화면" 문제를 해결하기 위해 텐서 드리프트를 계산하고 NaN에 도달하기 전에 값을 클램프합니다.
5. T-X 보간기 (wan_tx_node.py)
기능: 시작 이미지와 끝 이미지 사이의 비디오를 생성합니다.
혁신: 단순한 블렌딩이 아닌 변환 경로를 환상하도록 역구조 반발을 사용합니다.
🎛️ 권장 워크플로우 전략
최고의 8K OLED 룩을 얻으려면 노드를 다음 순서로 연결하세요:
로더:
Cyberdyne Model Hub(모델 및 VAE 로드).프롬프트:
Wan Text Cache및Wan Vision Cache.생성:
WanImageToVideoUltra→XT-404 Skynet 1 (마스터).정제:
XT-404 Skynet 3 (리파이너)(노이즈 제거 0.3).디코딩:
VAE 디코딩.비주얼 우월성 스택:
템포럴 잠금 프로(픽셀 안정화).OLED 다이내믹스(빛 조형).오가닉 스킨(텍스처 추가).
최종 정제:
Wan Chroma Mimic(신호 검증 및 선명화).인코딩:
비디오 결합→Wan 압축기.
📟 콘솔 HUD (XT-Mouchard)
콘솔을 무시하지 마세요! 이 스위트는 신호 건강 상태를 전달합니다:
🟢 녹색: 신호가 정상입니다.
🟡 노랑색: 고신호 감지됨(롤오프 활성화).
🔴 빨강색: 심각한 포화/클리핑(
specular_pop감소).
예제 로그:
[XT-MIMIC] 🎨 FINAL VALIDATION | DynRange: [0.000, 0.982]
└── Signal Integrity: OK (Clip: 0.00%)
이것은 수학적으로 완벽한 검정과 흰색을 98.2%로 제한하여 디스플레이 블룸을 허용한다는 의미입니다.
📜 크레딧
건축가: XT-404 Omega
회사: Cyberdyne Systems
상태: GOLD MASTER (V3.8)
"운명은 우리가 만드는 것 외에 없다."
Cyberdyne 연구부에서 유지 관리. "침투 보고서"는 이슈로 열어주세요.
🤖 XT-404 Skynet : Wan 2.2 센티넬 스위트 (OMEGA EDITION)
Cyberdyne Systems Corp. | 시리즈 T-800 | 모델 101
"미래는 정해져 있지 않다. 우리가 스스로 만드는 것 외에 운명은 없다."
⚠️ 필수 시스템 의존성
경고
INFILTRATION PROTOCOL (GGUF): Cyberdyne Model Hub와 GGUF 양자화 모델을 사용하려면 ComfyUI-GGUF 엔진이 필수입니다.
📥 엔진 다운로드: city96/ComfyUI-GGUF
이 엔진 없이 Cyberdyne Model Hub는 Safetensors 전용 모드로만 작동합니다.
🚀 왜 XT-404 Skynet을 선택해야 할까? (경쟁 분석)
표준 노드는 일반적인 구현에 의존합니다. XT-404 Skynet은 Wan 2.2의 특이성에 맞춰 특별히 설계된 커스텀 아키텍처입니다.
기능 | 표준 노드 / 경쟁사 | 🤖 XT-404 Skynet 아키텍처
정밀도 | 표준 FP16/BF16 (밴딩 발생 가능) | 하이브리드 FP32/TF32 컨텍스트 스위칭 (밴딩 없음)
보간 | 기본 선형 페이드 (정지/정적) | T-X 이중상태 래퍼 (네이티브 VAE 주입)
색상 과학 | RGB 클리핑 | LAB 공간 전환 및 OLED 다이내믹스 (시네마 등급)
캐싱 | 기본 TeaCache (모션 정지 위험) | T-3000 Genisys + 운동량 및 나노 리페어
스케일링 | 바일리니어 (흐릿함) | Lanczos/Bicubic FP32 (픽셀 완벽)
메모리 | 높은 VRAM 사용 (OOM 위험) | 수술적 고정 메모리(DMA) 및 적극적인 정리
🌍 신경망 네비게이션
🇺🇸 영문 문서
🇫🇷 프랑스어 문서
자세한 기술 정보는 프랑스어 버전을 참조하세요.
🇺🇸 영문 문서
🎨 Phase 0: 비주얼 엔지니어링 (Wan Chroma Mimic)
파일: wan_chroma_mimic.py
최고의 컬러 그레이딩 엔진. 이는 단순한 필터가 아닙니다. GPU에서 실시간으로 작동하며, 이미지 텐서를 LAB 색상 공간으로 변환하여 밝기와 색상 정보를 분리하여 조명 데이터를 손상시키지 않고 시네마 등급의 레퍼런스를 가능하게 합니다.
🔥 주요 기능 및 구성
아키텍처: 100% PyTorch GPU. 0% CPU 지연.
형태학적 필터: 비디오 확산으로 생성된 마이크로 아티팩트(검정/흰색 점)가 확장되기 전에 제거합니다.
OLED 다이내믹스: 0.5를 중심으로 비선형 S-커브를 적용하여 검정을 깊게 하고 최대 하이라이트를 보존합니다.
매개변수 권장 설명 reference_image 필수 소스 이미지(스타일 참조). 분위기는 여기서 추출됩니다. effect_intensity 0.25 LAB 전송의 블렌딩 강도. oled_contrast 0.00 "Netflix" 룩. 동적 범위를 강화합니다. 0.0 = 중립. skin_metal_smooth 0.25 스마트 표면 블러. 피부/금속을 부드럽게 하지만 엣지를 감지하여 선명도를 유지합니다. detail_crispness 0.2 시네마 피케. 차이-가우시안 방식을 사용하여 미세 디테일을 강화합니다.
🛡️ Phase 1: 침투 (Cyberdyne 모델 허브)
파일: cyberdyne_model_hub.py
Safetensors 및 GGUF 아키텍처를 연결하는 통합 로더입니다. Wan 2.2의 "이중 UNet" 요구 사항을 자동으로 해결합니다.
재귀적 스캐너: 하위 폴더에서 모델을 찾습니다.
Skynet 프로토콜: 활성 VRAM 관리. 로딩 전에 체크섬(SHA256)을 계산하고 프래그멘테이션을 방지하기 위해 메모리를 정리합니다.
하이브리드 로딩: 고해상도 FP16 모델과 저해상도 GGUF 모델을 동시에 로드할 수 있습니다.
🧠 Phase 2: 신경망 코어 (XT-404 샘플러)
파일: XT404_Skynet_Nodes.py
"Sentinel" 엔진입니다. 표준 샘플러와 달리, 이들은 Wan 2.2에서 요구하는 simple (선형) 스케줄러가 하드코딩되어 있어 표준 KSamplers에서 발생하는 "과도한 출력" 문제를 방지합니다.
🔴 XT-404 Skynet 1 (마스터)
Shift 값 (5.0): Wan 2.2 잠재적 타이밍을 위한 핵심 설정.
Bongmath 엔진: 맞춤형 텍스처 노이즈 주입 시스템.
True: 아날로그 필름 그레인 일관성 추가.False: 순수 디지털 청결함.
🟡 XT-404 Skynet 2 (체인)
- 시드 잠금:
options사전을 통해 마스터 노드에서 시드를 자동으로 상속합니다. 생성 단계 간 시간적 일관성을 보장합니다.
🟢 XT-404 Skynet 3 (리파이너)
- 리샘플 모드: 체인 마지막 단계에서 제어된 노이즈를 주입하여 고주파 디테일을 환상적으로 생성합니다.
💀 Phase 3: T-3000 Genisys (전지전능 캐시)
파일: wan_genisys.py
TeaCache보다 우수합니다. 표준 TeaCache는 차이가 너무 낮을 때 비디오 움직임을 정지시킵니다. T-3000은 "운동 모멘텀"을 사용합니다.
운동 모멘텀: 움직임이 감지되면 다음 X프레임의 계산을 강제하여 "인형 챌린지" 효과를 방지합니다.
나노 수리: 텐서 스트림에서
NaN또는Inf값(검은 화면 버그)을 감지하고 하드 클리핑 대신 소프트 클램핑(-10/+10)을 사용하여 수술적으로 수리합니다.HUD: 콘솔에 실시간 신호 무결성 및 드리프트 메트릭을 표시합니다.
🎭 Phase 4: 모방 렌더링 (I2V Ultra 및 품질)
파일: nodes_wan_ultra.py / wan_fast.py
🌟 Wan Ultra (품질의 왕)
핵심 정규화: Bicubic-AntiAlias를 사용하여 입력 이미지를 엄격히 0.0-1.0 범위로 정제합니다.
디테일 강화: VAE 인코딩 전에 샤프닝 컨볼루션 행렬을 적용하여 압축 블러를 보완합니다.
모션 증폭: 물리 법칙을 깨지 않으면서 "소프트 리미터"(Tanh 곡선)를 사용하여 모션 벡터를 증폭합니다.
⚡ Wan Fidelity (속도의 왕)
최적화: 메모리 효율을 위해 연결 대신
torch.full을 사용합니다.논리: 완벽한 시간적 일관성을 위해 원래 Wan 2.1 컨텍스트 윈도우 논리를 복원합니다.
🧪 Phase 6.5: 다중 계측 합금 (T-X 이중상) [새로운 기능]
파일: wan_tx_node.py
보간 특이점. 표준 I2V 모델은 특정 최종 프레임에 도달하는 데 어려움을 겪습니다(종종 정지되거나 스타일을 잃음). T-X 엔진은 네이티브 VAE 주입 래퍼를 사용하여 타임라인을 완벽하게 연결합니다.
키프레임 주입: 잠재 공간을 손상시키지 않고 [시작 프레임 -> 빈 공허 -> 종료 프레임]을 인코딩하기 위해 VAE 내부 논리를 일시적으로 재정의합니다.
유동적 변형: Wan 2.2 모델이 점 A와 점 B 사이의 물리 방정식을 해결하도록 강제하여 "슬라이드 쇼" 효과를 방지합니다.
스마트 VRAM 스캐너: GPU 용량을 자동으로 감지하여 "안전"(512px 타일링) 및 "울트라"(1280px 타일링) 모드 간 전환합니다.
매개변수 설명 start_image 원본 프레임(프레임 0). end_image 대상 프레임(프레임 N). T-X 엔진은 이 이미지로 수렴하도록 강제합니다. motion_amp 키프레임 사이의 잠재적 모션 벡터를 증폭합니다. detail_boost VAE 압축 중 텍스처를 유지하기 위한 전처리 샤프닝.
⚡ Phase 5: 센서 및 가속기 (Omega 도구)
🚀 Wan 하드웨어 가속기 (Anti-Burn V4)
파일: wan_accelerator.py 성능의 "비밀 소스".
문제: Wan 2.2에서 TF32를 활성화하면 정규화 오류로 인해 일반적으로 이미지가 "소실"(대비 문제)됩니다.
해결책(문맥 전환): 이 노드는 속도를 위해 전역적으로 TF32를 활성화하지만,
GroupNorm및LayerNorm레이어를 차단하여 FP32 정밀도로 강제합니다.결과: FP32의 시각적 품질을 유지하면서 TF32의 30% 속도 향상.
👁️ Wan 비전 및 텍스트 캐시 (DMA)
파일: wan_i2v_tools.py
고정 메모리: 텍스트 임베딩을 GPU로 즉시 전송하기 위해 CPU 페이지 잠금 메모리(DMA)를 사용합니다.
비전 해시: 이미지 콘텐츠(스트라이드 포함)를 해시하여 동일한 CLIP 비전 입력을 재인코딩하지 않습니다.
🛠️ Phase 6: 후처리 및 자동화
Wan 압축기 (Omega): 스레드 안전한 H.265 인코딩. Threadripper/i9 충돌을 방지하기 위해 CPU 스레드를 16개로 제한합니다.
Wan 사이클 종료기: Windows API
EmptyWorkingSet를 사용하여 RAM 대기 목록을 플러시합니다(OS 버벅임 방지).자동 Wan 최적화기: Wan에 필요한
Modulo 16치수를 강제로 적용하고 OOM(>1024px)을 방지하는 스마트 리사이저입니다.

