Simple Wan Video I2V 720 on 8Gb+ VRAM
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
8GB VRAM이라도 wan2.1-i2v-14b-720p-q6_k로 비디오 생성 가능 (16GB 이상 권장).
업데이트! v3:
테스트 생성은 576*1024 이미지로 수행했습니다. 총 89프레임, 프레임 레이트 22. 4단계 + 보간 x2로 초당 최대 44프레임.
8GB VRAM: 20-25분
16GB VRAM: 7-12분
32GB VRAM: 1-5분
__________________________________________________________________________________________________
v1:
테스트 생성은 512*512 이미지로 수행했습니다. 총 45프레임, 프레임 레이트 16. 25단계 + 보간 x2로 초당 최대 24프레임.
8GB VRAM: 40-70분
16GB VRAM: 15-25분
32GB VRAM: 6-15분
__________________________________________________________________________________________________
! 중요 !
이 작업을 실행하려면 다음이 필요합니다:
모델:
Self-Forcing / CausVid / Accvid LoRA (v3 워크플로우용)
어떤 CLIP 비전 모델도 가능 (저는 CLIP-ViT-H-14-laion2B-s32B-b79K.safetensors 사용)
어떤 Wan VAE도 가능 (저는 wan_2.1_vae.safetensors 사용)
노드 (매니저에서 누락된 노드만 설치):
사용 방법
애니메이션할 이미지를 업로드하세요. 이미지 크기는 중요하며, 비디오의 가로/세로 크기는 소스 이미지에서 가져옵니다.
WanImg2Vid 노드에서 생성할 프레임 수를 설정하세요.
Video Combine 노드에서 초당 프레임 수를 설정하세요.
끝입니다. 생성을 시작하세요.
Interpolate 및 프레임 확장 그룹을 활성화할 수도 있습니다. 이는 비디오 품질을 향상시키고
제 기준 작동 방식
초당 16프레임으로 비디오를 생성합니다. 보통 이때 45-55프레임을 생성합니다.
약 3-3.5초 분량의 비디오가 생성됩니다 (49fps/16f=3.06s). 생성된 프레임은 x2 보간을 통해 전송됩니다. 최종적으로 초당 24프레임의 부드러운 4-5초 비디오를 얻게 됩니다 (원본 49f*2=98f/24fps=4.08s, 부드러움과 1초의 비디오 확보).
x2 보간은 두 원본 프레임 사이에 하나의 프레임을 추가합니다. 배수를 늘리려면 2의 배수여야 합니다. 배수 4는 두 원본 프레임 사이에 두 개의 프레임을 생성합니다.
저는 배수 4를 사용하지 않는데, 슬로우모션 효과가 발생할 위험이 있기 때문입니다.
제게 완벽한 설정을 발견했습니다.
KSampler:
steps: 22-35
cfg: 4-5
sampler: uni_pc
scheduler: simple
denoise: 0.95-1
RTX 5060 16GB, 64GB RAM, i5-24600KF를 사용합니다. 4초 비디오의 안정적인 평균 생성 시간은 1000-1300초입니다.
모두 이미지 크기와 KSampler의 steps에 따라 달라집니다. 주로 512512 및 480720에서 작업합니다.
이것은 제가 지금까지 정상적인 품질과 속도를 얻은 첫 번째 워크플로우입니다. 적어도 저는 만족합니다.
시도해보세요. 누군가에게 도움이 되었으면 합니다.
P.S. 이 워크플로우를 계속 개선할 예정입니다. 관심 있는 분은 알려주세요.
