Kiko WanWrapper

세부 정보

파일 다운로드

모델 설명

🎞️ ComfyUI 이미지에서 영상으로 워크플로우 - WAN 2.1 Wrapper (Kiko WAN v3)

이것은 WAN 2.1 Wrapper를 기반으로 하며, torch.compileSage Attention과 같은 고급 최적화 기능을 통해 더 빠르고 지능적인 프레임 생성을 제공하는 고성능 다중 패스 이미지-영상 워크플로우입니다. 제가 이해할 수 있는 모든 설정을 Kijai가 제공하는 대로 노출하려고 노력했습니다 😉 이 워크플로우가 여기에서 가장 빠른 것은 아닐 수 있지만, 저는 이 워크플로우를 사용하여 20초 길이의 영상을 만들고 있습니다.

이 워크플로우는 Arch Linux에서 RTX 4090128GB RAM을 사용하여 ❤️로 작성되었습니다. 이 환경은 무거운 추론과 매끄러운 영상 생성에 최적화되어 있습니다.

🚀 기능

  • 🧠 영화 같은 이미지-영상 변환을 위한 WAN 2.1 Wrapper

  • 🔂 두 단계 생성: 초기 생성 + 세부 조정/확장

  • 🐌 옵션: 슬로우 모션 + 프레임 보간(RIFE, FILM 등)

  • 🧽 선명화확대(예: RealESRGAN, SwinIR)

  • 🛠️ torch.compile 포함으로 추론 속도 향상

  • 🌀 Sage Attention 통합으로 주의 메커니즘 효율성 개선

  • 📏 사용자 정의 프롬프트, 시드, 지속 시간 및 종횡비 논리

  • 🌀 "마지막 프레임 확장"을 통한 최종 루프 정제

⚙️ 시스템 사양

  • OS: Arch Linux(롤링 릴리스)

  • GPU: NVIDIA RTX 4090 (24GB VRAM)

  • RAM: 128 GB DDR5

  • Python: pyenv를 통한 3.12.9

  • ComfyUI: GitHub의 최신 빌드

  • torch: torch.compile 활성화된 2.x 버전

  • Sage Attention: 패치된 주의 메커니즘을 통해 활성화됨

🛠️ 워크플로우 개요

🔹 입력 및 크기 조정

  • 이미지를 드래그하여 WAN 2.1이 기대하는 입력 크기로 선택적으로 조정합니다.

🔹 WAN 2.1 Wrapper 핵심

  • 속도 향상을 위해 torch.compile 사용

  • Sage Attention으로 강화됨 (사용자 정의 노드 또는 환경 설정을 통해 설정)

🔹 단계 1: 생성 + 선택적 슬로우 모션

  • 프레임별 합성

  • 보간 노드(RIFE 또는 FILM)를 통해 슬로우 모션 추가

🔹 단계 2: 확장 및 병합

  • 움직임을 확장하여 더 부드러운 전환 보장

  • 정제된 프롬프트 가이던스와 움직임 결합

🔹 최종 정제

  • 선명화 및 확대

  • 필요 시 최종 보간

  • 마지막 프레임 확장으로 루프 준비된 출력 생성

🧪 성능 팁

  • torch compile은 시스템에 따라 최적화해야 합니다. 모든 시스템이 다르므로, 제 설정이 여러분에게 항상 적용되지 않을 수 있습니다.

  • Sage Attention 사용 시:

    • 노드를 사용하세요.
  • 저사양 GPU에서 실행 중인 경우: 확대 기능을 비활성화하고 프레임 수를 줄이세요.

🧰 요구 사항

  • ComfyUI

  • WAN 2.1 Wrapper 노드

  • 옵션:

    • 보간용: RIFE, FILM, 또는 DAIN

    • 확대용: RealESRGAN / SwinIR

    • Sage Attention 패치 또는 노드

▶️ 사용 방법

  1. ComfyUI에 kiko-wan-v3.json 파일을 로드합니다.

  2. 입력 노드에 이미지를 드래그합니다.

  3. 프롬프트, 지속 시간, 프레임 수를 사용자 정의합니다.

  4. Queue Prompt를 클릭하여 생성을 시작합니다.

  5. 생성된 영상은 출력 폴더에 저장됩니다.

📁 파일

  • kiko-wan-v3.json — 내보낸 워크플로우 (곧 제공 예정)

  • kiko-wan-v3.png — 워크플로우 다이어그램

🧠 영감 및 크레딧

  • ComfyUI

  • WAN 2.1 Wrapper

  • Real-ESRGAN, RIFE, FILM, Sage Attention 기여자들

  • 엘리트 워크스테이션 성능을 위한 Arch Linux + NVIDIA 생태계 😉

💡 향후 계획

  • 배치 이미지-영상 모드 추가

  • 오디오 지원?

⚙️ kiko-wan-wrapper-v3.json에서 사용된 사용자 정의 노드

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.