Wan 2.2 - I2V - XT-404 - Master UI

세부 정보

모델 설명

저의 개인적인 워크플로우일 뿐, 모델이나 노드를 만든 책임은 없습니다!!!
설명 아래의 노드와 모델을 사용하세요!!!

노드 > https://github.com/XT-404/XT-404_SKYNET

Lora Loader https://github.com/HenkDz/rgthree-comfy

모델 > https://civarchive.com/models/2244942?modelVersionId=2527274

🤖 XT-404 Skynet Suite: Wan 2.2 통합

ComfyUI용 "Omega Edition"

Skynet Banner Version Architecture License

XT-404 Skynet Suite는 ComfyUI용으로 특별히 설계된 고도로 전문화되고 검증된 커스텀 노드 모음으로, Wan 2.1 및 2.2 비디오 확산 모델에 최적화되었습니다.

표준 노드와 달리, 이 스위트는 "시각적 우월성"을 목표로 합니다—수학적 정밀도로 8K, OLED 등급의 품질을 달성합니다. 일반적인 처리를 버리고, 신호 무결성을 보호하고, VRAM을 정밀하게 관리하며 디지털 아티팩트를 제거하는 휴리스틱 및 컨텍스트 인식 알고리즘을 사용합니다.


⚠️ 요구 사항

  • ComfyUI: 최신 버전을 권장합니다.

  • Wan 2.2 모델: VAE, CLIP, UNet/Transformer 모델을 확보하세요.

  • Python: 3.10+

  • FFmpeg: Compressor 노드에 필요합니다(일반적으로 imageio-ffmpeg를 통해).

경고

INFILTRATION PROTOCOL (GGUF): Cyberdyne Model Hub와 GGUF 양자화 모델을 사용하려면 ComfyUI-GGUF 엔진이 필수입니다. 📥 엔진 다운로드: city96/ComfyUI-GGUF 이 엔진 없이 Cyberdyne Model Hub는 Safetensors 전용 모드로만 작동합니다.


🚀 주요 기능

  • 제로 포인트 노이즈 주입: 비디오 생성에서 정적 "눈사태"를 제거합니다.

  • ARRI 롤오프 톤 매핑: 고대비 장면에서도 흰색 클리핑을 방지합니다.

  • 나노 리페어(Genisys): TF32 정밀도로 인한 검은 화면/NaN을 방지하기 위한 실시간 텐서 모니터링.

  • OLED/8K 워크플로우: 깊은 검정, 유기적 그레인, 마이크로 디테일 환상에 특화된 전용 파이프라인.

  • 센티넬 텔레메트리: 실시간 콘솔 로그("The Mouchard")가 단계별로 채도, 클리핑 및 VRAM 사용량을 분석합니다.


📦 설치

ComfyUI 사용자 정의 노드 디렉토리로 이동하세요:

cd ComfyUI/custom_nodes/

이 저장소를 클론하세요:

git clone https://github.com/YourUsername/XT-404-Skynet-Suite.git

필요한 패키지를 설치하세요:

pip install imageio-ffmpeg scikit-image

🛠️ 모듈 분해

1. 코어 엔진 (XT404_Skynet_Nodes.py)

생성 과정의 핵심입니다. 표준 KSamplers를 Wan의 Flow Matching에 최적화된 하이브리드 엔진으로 대체합니다.

  • 제로 포인트 수정: 0 + 노이즈 = 순수 노이즈를 보장하여 주입 전 잠재 공간을 초기화합니다.

  • Wan 시그마 계산기: Wan 2.1/2.2에 필요한 특정 시프트 공식을 사용합니다.

  • 체인 아키텍처: 마스터 시그마 클록을 노드 간에 전달하여 "Hires Fix"를 지원합니다.

2. 유니버설 로더 (cyberdyne_model_hub.py)

체크포인트, SafeTensors 및 GGUF 모델을 위한 통합 로더입니다.

  • 재귀적 검색: 하위 디렉토리에서 모델을 자동으로 찾습니다.

  • GGUF 위임: GGUF 파일을 감지하여 적절한 백엔드로 라우팅합니다.

  • 스마트 오프로드: 사용하지 않는 모델을 RAM으로 적극적으로 오프로드하여 샘플러를 위한 VRAM을 확보합니다.

3. 비주얼 우월성 스위트 (wan_visual_supremacy.py)

"AI 플라스틱 룩"을 치유하는 "비밀 소스"입니다.

  • 잠재 디테일러 X: 디코딩 전 마이크로 디테일을 주입하면서 신호 포화를 방지합니다.

  • 템포럴 잠금 프로: 디코딩 후 안정화기로, 낮은 델타 프레임을 블렌딩하여 깜빡임을 제거합니다.

  • OLED 다이내믹스(ARRI 롤오프): 하이라이트 텍스처를 보존하는 로그리듬 압축 곡선입니다.

4. 나노 리페어 시스템 (wan_genisys.py)

  • 노드: Cyberdyne Genisys [OMNISCIENT]

  • 기능: TF32/BF16에서 발생하는 "검은 화면" 문제를 해결하기 위해 텐서 드리프트를 계산하고 NaN에 도달하기 전에 값을 클램프합니다.

5. T-X 보간기 (wan_tx_node.py)

  • 기능: 시작 이미지와 끝 이미지 사이의 비디오를 생성합니다.

  • 혁신: 단순한 블렌딩이 아닌 변환 경로를 환상하도록 역구조 반발을 사용합니다.


🎛️ 권장 워크플로우 전략

최고의 8K OLED 룩을 얻으려면 노드를 다음 순서로 연결하세요:

  1. 로더: Cyberdyne Model Hub(모델 및 VAE 로드).

  2. 프롬프트: Wan Text CacheWan Vision Cache.

  3. 생성: WanImageToVideoUltraXT-404 Skynet 1 (마스터).

  4. 정제: XT-404 Skynet 3 (리파이너) (노이즈 제거 0.3).

  5. 디코딩: VAE 디코딩.

  6. 비주얼 우월성 스택:

    • 템포럴 잠금 프로(픽셀 안정화).

    • OLED 다이내믹스(빛 조형).

    • 오가닉 스킨(텍스처 추가).

  7. 최종 정제: Wan Chroma Mimic(신호 검증 및 선명화).

  8. 인코딩: 비디오 결합Wan 압축기.


📟 콘솔 HUD (XT-Mouchard)

콘솔을 무시하지 마세요! 이 스위트는 신호 건강 상태를 전달합니다:

  • 🟢 녹색: 신호가 정상입니다.

  • 🟡 노랑색: 고신호 감지됨(롤오프 활성화).

  • 🔴 빨강색: 심각한 포화/클리핑( specular_pop 감소).

예제 로그:

[XT-MIMIC] 🎨 FINAL VALIDATION | DynRange: [0.000, 0.982]
   └── Signal Integrity: OK (Clip: 0.00%)

이것은 수학적으로 완벽한 검정과 흰색을 98.2%로 제한하여 디스플레이 블룸을 허용한다는 의미입니다.


📜 크레딧

  • 건축가: XT-404 Omega

  • 회사: Cyberdyne Systems

  • 상태: GOLD MASTER (V3.8)

"운명은 우리가 만드는 것 외에 없다."


Cyberdyne 연구부에서 유지 관리. "침투 보고서"는 이슈로 열어주세요.


🤖 XT-404 Skynet : Wan 2.2 센티넬 스위트 (OMEGA EDITION)

Cyberdyne Systems Corp. | 시리즈 T-800 | 모델 101

Version Architecture Engine New Module

"미래는 정해져 있지 않다. 우리가 스스로 만드는 것 외에 운명은 없다."


⚠️ 필수 시스템 의존성

경고

INFILTRATION PROTOCOL (GGUF): Cyberdyne Model Hub와 GGUF 양자화 모델을 사용하려면 ComfyUI-GGUF 엔진이 필수입니다.

📥 엔진 다운로드: city96/ComfyUI-GGUF

이 엔진 없이 Cyberdyne Model Hub는 Safetensors 전용 모드로만 작동합니다.


🚀 왜 XT-404 Skynet을 선택해야 할까? (경쟁 분석)

표준 노드는 일반적인 구현에 의존합니다. XT-404 SkynetWan 2.2의 특이성에 맞춰 특별히 설계된 커스텀 아키텍처입니다.

기능 | 표준 노드 / 경쟁사 | 🤖 XT-404 Skynet 아키텍처
정밀도 | 표준 FP16/BF16 (밴딩 발생 가능) | 하이브리드 FP32/TF32 컨텍스트 스위칭 (밴딩 없음)
보간 | 기본 선형 페이드 (정지/정적) | T-X 이중상태 래퍼 (네이티브 VAE 주입)
색상 과학 | RGB 클리핑 | LAB 공간 전환 및 OLED 다이내믹스 (시네마 등급)
캐싱 | 기본 TeaCache (모션 정지 위험) | T-3000 Genisys + 운동량 및 나노 리페어
스케일링 | 바일리니어 (흐릿함) | Lanczos/Bicubic FP32 (픽셀 완벽)
메모리 | 높은 VRAM 사용 (OOM 위험) | 수술적 고정 메모리(DMA) 및 적극적인 정리


🌍 신경망 네비게이션

🇺🇸 영문 문서

  1. 비주얼 엔지니어링 (Wan Chroma Mimic)

  2. 침투 (모델 로더)

  3. 신경망 코어 (XT-404 샘플러)

  4. T-3000 Genisys (전지능 캐시)

  5. 모방 렌더링 (I2V Ultra 및 품질)

  6. 다중계합 합금 (T-X 이중상태) 🆕

  7. 센서 및 가속기 (Omega 도구)

  8. 포스트 프로세싱 및 자동화

🇫🇷 프랑스어 문서

자세한 기술 정보는 프랑스어 버전을 참조하세요.


🇺🇸 영문 문서

🎨 Phase 0: 비주얼 엔지니어링 (Wan Chroma Mimic)

파일: wan_chroma_mimic.py

최고의 컬러 그레이딩 엔진. 이는 단순한 필터가 아닙니다. GPU에서 실시간으로 작동하며, 이미지 텐서를 LAB 색상 공간으로 변환하여 밝기와 색상 정보를 분리하여 조명 데이터를 손상시키지 않고 시네마 등급의 레퍼런스를 가능하게 합니다.

🔥 주요 기능 및 구성

  • 아키텍처: 100% PyTorch GPU. 0% CPU 지연.

  • 형태학적 필터: 비디오 확산으로 생성된 마이크로 아티팩트(검정/흰색 점)가 확장되기 전에 제거합니다.

  • OLED 다이내믹스: 0.5를 중심으로 비선형 S-커브를 적용하여 검정을 깊게 하고 최대 하이라이트를 보존합니다.

매개변수 권장 설명 reference_image 필수 소스 이미지(스타일 참조). 분위기는 여기서 추출됩니다. effect_intensity 0.25 LAB 전송의 블렌딩 강도. oled_contrast 0.00 "Netflix" 룩. 동적 범위를 강화합니다. 0.0 = 중립. skin_metal_smooth 0.25 스마트 표면 블러. 피부/금속을 부드럽게 하지만 엣지를 감지하여 선명도를 유지합니다. detail_crispness 0.2 시네마 피케. 차이-가우시안 방식을 사용하여 미세 디테일을 강화합니다.


🛡️ Phase 1: 침투 (Cyberdyne 모델 허브)

파일: cyberdyne_model_hub.py

Safetensors 및 GGUF 아키텍처를 연결하는 통합 로더입니다. Wan 2.2의 "이중 UNet" 요구 사항을 자동으로 해결합니다.

  • 재귀적 스캐너: 하위 폴더에서 모델을 찾습니다.

  • Skynet 프로토콜: 활성 VRAM 관리. 로딩 전에 체크섬(SHA256)을 계산하고 프래그멘테이션을 방지하기 위해 메모리를 정리합니다.

  • 하이브리드 로딩: 고해상도 FP16 모델과 저해상도 GGUF 모델을 동시에 로드할 수 있습니다.


🧠 Phase 2: 신경망 코어 (XT-404 샘플러)

파일: XT404_Skynet_Nodes.py

"Sentinel" 엔진입니다. 표준 샘플러와 달리, 이들은 Wan 2.2에서 요구하는 simple (선형) 스케줄러가 하드코딩되어 있어 표준 KSamplers에서 발생하는 "과도한 출력" 문제를 방지합니다.

🔴 XT-404 Skynet 1 (마스터)

  • Shift 값 (5.0): Wan 2.2 잠재적 타이밍을 위한 핵심 설정.

  • Bongmath 엔진: 맞춤형 텍스처 노이즈 주입 시스템.

    • True: 아날로그 필름 그레인 일관성 추가.

    • False: 순수 디지털 청결함.

🟡 XT-404 Skynet 2 (체인)

  • 시드 잠금: options 사전을 통해 마스터 노드에서 시드를 자동으로 상속합니다. 생성 단계 간 시간적 일관성을 보장합니다.

🟢 XT-404 Skynet 3 (리파이너)

  • 리샘플 모드: 체인 마지막 단계에서 제어된 노이즈를 주입하여 고주파 디테일을 환상적으로 생성합니다.

💀 Phase 3: T-3000 Genisys (전지전능 캐시)

파일: wan_genisys.py

TeaCache보다 우수합니다. 표준 TeaCache는 차이가 너무 낮을 때 비디오 움직임을 정지시킵니다. T-3000은 "운동 모멘텀"을 사용합니다.

  • 운동 모멘텀: 움직임이 감지되면 다음 X프레임의 계산을 강제하여 "인형 챌린지" 효과를 방지합니다.

  • 나노 수리: 텐서 스트림에서 NaN 또는 Inf 값(검은 화면 버그)을 감지하고 하드 클리핑 대신 소프트 클램핑(-10/+10)을 사용하여 수술적으로 수리합니다.

  • HUD: 콘솔에 실시간 신호 무결성 및 드리프트 메트릭을 표시합니다.


🎭 Phase 4: 모방 렌더링 (I2V Ultra 및 품질)

파일: nodes_wan_ultra.py / wan_fast.py

🌟 Wan Ultra (품질의 왕)

  • 핵심 정규화: Bicubic-AntiAlias를 사용하여 입력 이미지를 엄격히 0.0-1.0 범위로 정제합니다.

  • 디테일 강화: VAE 인코딩 전에 샤프닝 컨볼루션 행렬을 적용하여 압축 블러를 보완합니다.

  • 모션 증폭: 물리 법칙을 깨지 않으면서 "소프트 리미터"(Tanh 곡선)를 사용하여 모션 벡터를 증폭합니다.

⚡ Wan Fidelity (속도의 왕)

  • 최적화: 메모리 효율을 위해 연결 대신 torch.full을 사용합니다.

  • 논리: 완벽한 시간적 일관성을 위해 원래 Wan 2.1 컨텍스트 윈도우 논리를 복원합니다.


🧪 Phase 6.5: 다중 계측 합금 (T-X 이중상) [새로운 기능]

파일: wan_tx_node.py

보간 특이점. 표준 I2V 모델은 특정 최종 프레임에 도달하는 데 어려움을 겪습니다(종종 정지되거나 스타일을 잃음). T-X 엔진네이티브 VAE 주입 래퍼를 사용하여 타임라인을 완벽하게 연결합니다.

  • 키프레임 주입: 잠재 공간을 손상시키지 않고 [시작 프레임 -> 빈 공허 -> 종료 프레임]을 인코딩하기 위해 VAE 내부 논리를 일시적으로 재정의합니다.

  • 유동적 변형: Wan 2.2 모델이 점 A와 점 B 사이의 물리 방정식을 해결하도록 강제하여 "슬라이드 쇼" 효과를 방지합니다.

  • 스마트 VRAM 스캐너: GPU 용량을 자동으로 감지하여 "안전"(512px 타일링) 및 "울트라"(1280px 타일링) 모드 간 전환합니다.

매개변수 설명 start_image 원본 프레임(프레임 0). end_image 대상 프레임(프레임 N). T-X 엔진은 이 이미지로 수렴하도록 강제합니다. motion_amp 키프레임 사이의 잠재적 모션 벡터를 증폭합니다. detail_boost VAE 압축 중 텍스처를 유지하기 위한 전처리 샤프닝.


⚡ Phase 5: 센서 및 가속기 (Omega 도구)

🚀 Wan 하드웨어 가속기 (Anti-Burn V4)

파일: wan_accelerator.py 성능의 "비밀 소스".

  • 문제: Wan 2.2에서 TF32를 활성화하면 정규화 오류로 인해 일반적으로 이미지가 "소실"(대비 문제)됩니다.

  • 해결책(문맥 전환): 이 노드는 속도를 위해 전역적으로 TF32를 활성화하지만, GroupNormLayerNorm 레이어를 차단하여 FP32 정밀도로 강제합니다.

  • 결과: FP32의 시각적 품질을 유지하면서 TF32의 30% 속도 향상.

👁️ Wan 비전 및 텍스트 캐시 (DMA)

파일: wan_i2v_tools.py

  • 고정 메모리: 텍스트 임베딩을 GPU로 즉시 전송하기 위해 CPU 페이지 잠금 메모리(DMA)를 사용합니다.

  • 비전 해시: 이미지 콘텐츠(스트라이드 포함)를 해시하여 동일한 CLIP 비전 입력을 재인코딩하지 않습니다.


🛠️ Phase 6: 후처리 및 자동화

  • Wan 압축기 (Omega): 스레드 안전한 H.265 인코딩. Threadripper/i9 충돌을 방지하기 위해 CPU 스레드를 16개로 제한합니다.

  • Wan 사이클 종료기: Windows API EmptyWorkingSet를 사용하여 RAM 대기 목록을 플러시합니다(OS 버벅임 방지).

  • 자동 Wan 최적화기: Wan에 필요한 Modulo 16 치수를 강제로 적용하고 OOM(>1024px)을 방지하는 스마트 리사이저입니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.