WAN2.2 5B - Unlimited Long Video Generation Loop

세부 정보

파일 다운로드

모델 설명

이 강력한 ComfyUI 워크플로우를 통해 무한한 비디오 내러티브의 잠재력을 열어보세요. 이 설정은 WAN2.2 5B 텍스트-비디오 모델을 전용으로 설계되었으며, 지능형 피드백 루프를 구현하여 길고 일관된 비디오 시퀀스를 자동으로 생성합니다. 단순히 클립을 연결하는 것이 아니라, 시각적으로 일관되고 역동적으로 진화하는 스토리를 창출합니다.

✨ 주요 기능 및 핵심 장점:

  • AI 기반 프롬프트 체인링: 이 워크플로우의 핵심입니다. Ollama 멀티모달 LLM(Qwen2.5-VL 등)이 각 생성된 비디오 클립의 마지막 프레임을 분석하고, 다음 세그먼트를 위한 새로운 자세한 프롬프트를 자동으로 생성합니다. 이를 통해 각 새 클립이 이전 클립과 논리적으로 연결됩니다.

  • 장편 콘텐츠에 최적화: 수동 개입 없이 다단계 장면, 진화하는 변화, 무한한 걷기 사이클을 생성할 수 있습니다. 루프는 원하는 횟수만큼 설정 가능합니다.

  • 우수한 시각적 일관성: 색상 매칭 노드(easy imageColorMatch)를 활용하여 세그먼트 간 색상과 톤을 조화시켜, 시각적 급작스러움을 방지하고 매끄러운 흐름을 창출합니다.

  • 내장된 품질 향상 기능: RIFE VFI 프레임 보간 노드가 최종 결합된 비디오의 프레임 속도를 두 배로 증가시켜 부드러운 움직임을 제공합니다.

  • 완전 자동화된 파이프라인: 초기 이미지 로드부터 최종 고품질 비디오 렌더링까지, 초기 설정 후에는 전 과정이 수동 개입 없이 자동 실행됩니다.

🛠️ 작동 원리:

  1. 준비: 워크플로우는 초기 이미지로 시작하며, 이 이미지는 스케일링되고 분석됩니다.

  2. Ollama 시각 분석: LLM이 이미지를 분석하고, WAN2.2 모델에 맞춰 동작 중심의 역동적인 프롬프트를 생성합니다.

  3. 비디오 생성: WAN2.2 5B 모델이 이 AI가 생성한 프롬프트를 바탕으로 짧은 비디오 클립(약 5초)을 생성합니다.

  4. 루프 및 개선: 마지막 프레임이 추출되고, 색상 보정된 후 Ollama로 다시 피드백되어 다음 프롬프트를 생성합니다. 이 루프는 설정한 반복 횟수만큼 반복됩니다.

  5. 최종 결합: 모든 개별 클립이 하나의 매끄럽고 장편 비디오 파일로 결합됩니다.

📦 포함된 내용:

  • ComfyUI용 .json 워크플로우 파일.

  • 노드 그룹과 각 기능에 대한 상세한 설명.

  • 최적의 결과를 위한 권장 설정.

⚙️ 권장 모델:

  • 텍스트-이미지-비디오: wan2.2_ti2v_5B_fp16.safetensors

  • LoRA: Wan2_2_5B_FastWanFullAttn_lora_rank_128_bf16.safetensors (빠른 생성을 위해)

  • VAE: wan2.2_vae.safetensors

  • LLM(Ollama용): qwen2.5-vl:7b 또는 llava-1.6 같은 시각 기능을 갖춘 모델

🎯 적합한 사용 사례:

  • 진화하는 시각 효과를 가진 뮤직비디오 제작.

  • 장편 애니메이션 및 스토리 시퀀스 생성.

  • 역동적인 소셜 미디어 콘텐츠 루프 제작.

  • AI 기반 스토리텔링 및 장면 전개 실험.

주의사항: 이 워크플로우는 필요한 커스텀 노드(ComfyUI-Easy-Use, Video-Helper-Suite, ComfyUI-Ollama, ComfyUI-Frame-Interpolation)가 설치된 적절히 설정된 ComfyUI 환경과, 시각 모델이 실행 중인 Ollama 서버가 필요합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.