WAN 2.2 GGUF/start end frame/t2v/i2v 8gb/10 seconds to 4 minutes workflow

세부 정보

파일 다운로드

모델 설명

WAN 2.2 – 첫 번째 프레임에서 마지막 프레임까지의 시네마틱 워크플로우 (원형/희소Sage 어텐션 패치 적용)

백루프 없이 초안정적인 10초 영상 생성

전체 윈도우 가이드 (Triton • SpargeAttn • RadialAttn)

실행 환경 요구사항:

윈도우 • Python 3.10–3.11 • RTX 4060 Ti 8GB 이상

ComfyUI 버전: 0.3.6+
WAN 버전: WAN 2.2 GGUF (VAC + CLIP) / 원하는 모델로 자유롭게 전환 가능


이 워크플로우의 기능

이 프로젝트는 다음을 포함하는 완벽하게 안정적인 10초 영상을 생성합니다:

  • 핑퐁 효과 없음

  • 프레임 붕괴 없음

  • 형태 변형 아티팩트 없음

  • 완벽한 시작 → 끝 보간

  • 전체 월드 스페이스 움직임 (픽셀 형태 변형 아님)

  • 높은 시간적 안정성

  • 시네마틱 카메라 동작

  • 옵션: 필름-VFI 슬로우 모션

  • 옵션: x4 업스케일 + 샤프닝

기본 WAN 또는 일반 샘플러와 달리, 이 버전은 다음을 사용합니다:

SparseSageAttn + RadialAttn
WAN의 어텐션 윈도우를 약 80프레임에서 161프레임 이상으로 확장합니다.

이로 인해 WAN은 완전한 10초를 일관된 하나의 장면으로 렌더링할 수 있습니다.


기능

  • 진정한 첫 프레임에서 마지막 프레임까지의 월드 빌딩

  • SD3 “Shift” 파라미터 (권장: 10초 클립에 50)

  • 시작 + 종료 이미지 지원 (24개 완전 제어 장면)

  • 이미지-투-비디오 및 텍스트-투-비디오 모두 지원

  • 부드러운 시네마틱 동작

  • 필름 그레인, 안개, 모노크롬 안정성

  • 옵션: ClearReality x4 업스케일

  • 옵션: 샤프닝 패스

  • 8GB GPU와 호환


🔧 설치 (윈도우)

단계 1 — 윈도우용 Triton 설치

WAN 2.2 + RadialAttn은 Triton을 필요로 합니다.
적절한 윈도우 wheel을 여기서 다운로드하세요:
https://github.com/woct0rdho/triton-windows/releases

venv 내부에 설치하세요.

단계 2 — SparseSageAttn 설치

다음에서 윈도우 wheel을 다운로드하세요:
https://github.com/woct0rdho/SpargeAttn/releases

venv 내부에 설치하세요.

단계 3 — RadialAttn 노드 설치

다음에서 다운로드하세요:
https://github.com/woct0rdho/ComfyUI-RadialAttn

ComfyUI의 custom_nodes 폴더에 배치하세요.

단계 4 — ComfyUI 재시작

Sparse / Radial Attn이 정상 로드되면, 시작 로그에 다음이 표시됩니다:
“Using sparse_sage_attn as block_sparse_sage2_attn_cuda”

이제 패치가 활성화되었습니다.


📸 워크플로우 작동 방식

1. Shift 노드 (SD3 스타일 컨디셔닝)

SHIFT 값을 높이면 WAN에 다음과 같이 지시합니다:
“시간이 지나도 장면을 물리적으로 일관되게 유지하라.”

초당 권장 값:
SHIFT = 초 × 5
→ 10초의 경우: SHIFT = 50

이 값은 전체 월드 동작을 안정화시킵니다.


2. 첫 번째에서 마지막 프레임까지 샘플러

다음 입력을 사용합니다:

  • 시작 프레임 (이미지 A)

  • 종료 프레임 (이미지 B)

그리고 161프레임에 걸쳐 부드러운 월드 스페이스 보간을 생성합니다.

어텐션 패치는 WAN의 시간적 메모리를 확장하여 핑퐁 현상을 완전히 제거합니다.


3. FILM VFI (옵션)

활성화 시, FPS를 부드럽게 2배 또는 4배로 증가시킵니다.
기본 렌더 후 적용하세요.


4. 업스케일 (옵션)

  • 업스케일 모델 = ClearReality x4

중요 팁

8GB GPU 사용 시:

  • VFI 후 업스케일을 수행하세요.
    VRAM 과부하를 방지하기 위해

  • 테스트 중에는 업스케일을 비활성화하세요 (업스케일 + 샤프닝을 그룹 토글로 묶으세요)


🎥 워크플로우 사용 방법

1. 시작 및 종료 이미지 로드

각 장면마다 한 쌍의 이미지(A → B)를 사용하세요.

2. 시네마틱 프롬프트 입력

예시 프롬프트 구조:

“영상은 안개 낀 독일의 숲에서 시작한다. 카메라가 진흙투성이의 길을 따라 천천히 앞으로 이동한다. 형태 변형 없음. 이는 연속된 세계이다. 영상 마지막에 카메라는 버려진 마을에 도달하며, 동일한 시네마틱 모노크롬 스타일을 유지한다.”

3. SHIFT = 50 설정

(10초 기준)

4. 첫 프레임에서 마지막 프레임까지 렌더링

WAN이 161프레임의 전체 동작을 직접 생성합니다.

5. 옵션: FILM VFI 활성화

슬로우 모션/더 부드러운 움직임을 위해 사용. 예: WAN 2.2는 16fps로 학습됨 - VFI x2로 설정하면 출력 32fps, VFI x4로 설정하면 출력 64fps.

6. 옵션: 업스케일 및 샤프닝 활성화

최대 선명도를 위해 사용하세요.


설치에 도움이 필요할 경우

이 전체 설명을 복사하여 ChatGPT에 붙여넣고 다음을 물어보세요:

“위에 설명된 대로 WAN 2.2 첫 프레임에서 마지막 프레임까지 워크플로우를 정확히 재현하고 싶습니다 (Triton, SparseSageAttn, RadialAttn, SD3 SHIFT = 50, 이중 KSampler, 옵션 업스케일/샤프닝 섹션 포함).
ComfyUI에서 이 워크플로우를 단계별로 다시 구축하는 데 도와주세요.”

그러면 안내해 줄 것입니다.


🏁 최종 노트

이 워크플로우는 다음 용도로 설계되었습니다:

  • 시네마틱 여행 촬영

  • 월드 빌딩

  • 안정적인 장시간 시퀀스

  • 장면 간 스토리텔링

  • 최소 아티팩트로 일관된 움직임

SHIFT, 첫 프레임에서 마지막 프레임까지, 어텐션 패칭의 조합이 루핑 없이 진정한 10초 장면을 가능하게 합니다.


보너스 팁:
한 장면의 “마지막 프레임 추출기” 출력을 다음 장면의 “시작 이미지” 입력에 연결함으로써 여러 장면을 하나의 연속된 영화로 이어붙일 수 있습니다. 이 방식은 이미지를 수동으로 다시 로드하지 않고도 완벽하게 정렬된 전환을 보장합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.