Wan Video 2.2

세부 정보

모델 설명

Wan Video

참고: Civitai에는 다른 Wan Video 파일도 호스팅되어 있지만, 이는 중복일 수 있으며, 이 모델 카드는 주로 Civitai Generator에서 사용되는 Wan Video 파일을 호스팅하기 위한 것입니다.

이 파일들은 ComfyUI Repack입니다. 원본 파일은 여기에서 Diffusers/multi-part safetensors 형식으로 확인할 수 있습니다.

Wan2.2는 시각적 생성 모델의 주요 업그레이드 버전으로, 이제 오픈소스화되어 더 강력한 기능, 향상된 성능 및 우수한 시각적 품질을 제공합니다. Wan2.2에서는 다음과 같은 기술적 혁신을 중심으로 개발했습니다:

👍 MoE 아키텍처: Wan2.2는 비디오 확산 모델에 혼합 전문가(Mixture-of-Experts, MoE) 아키텍처를 도입했습니다. 시간 단계 간의 노이즈 제거 과정을 전문화된 강력한 전문 모델로 분리함으로써, 계산 비용을 동일하게 유지하면서 전체 모델 용량을 확장합니다.

💪🏻 데이터 확장: Wan2.1과 비교하여, Wan2.2는 이미지 기반 데이터가 +65.6% 증가하고, 비디오 기반 데이터가 +83.2% 증가한 대규모 데이터셋으로 학습되었습니다. 이 확장은 동작, 의미, 미적 요소 등 다양한 차원에서 모델의 일반화 능력을 현저히 향상시켜, 오픈소스 및 폐쇄형 모델 중 최고 성능을 달성했습니다.

🎬 시네마틱 미학: Wan2.2는 조명, 구도, 색상에 대한 세밀한 레이블이 부여된 특별히 선별된 미학 데이터를 통합했습니다. 이를 통해 더 정밀하고 제어 가능한 시네마틱 스타일 생성이 가능해지며, 사용자가 원하는 미적 선호도에 맞춘 비디오 생성을 지원합니다.

🚀 효율적인 고해상도 하이브리드 TI2V: Wan2.2는 5B 규모의 모델을 오픈소스화했으며, 이 모델은 16×16×4의 압축 비율을 달성하는 고급 Wan2.2-VAE를 기반으로 구축되었습니다. 이 모델은 720P 해상도, 24fps로 텍스트-비디오 및 이미지-비디오 생성을 지원하며, 4090과 같은 소비자용 그래픽 카드에서도 실행 가능합니다. 현재 제공되는 가장 빠른 720P@24fps 모델 중 하나이며, 산업 및 학술 분야를 동시에 충족할 수 있습니다.

Wan2.2-T2V-A14B

T2V-A14B 모델은 480P 및 720P 해상도에서 5초 길이의 비디오 생성을 지원합니다. 혼합 전문가(MoE) 아키텍처를 기반으로 구축되어 뛰어난 비디오 생성 품질을 제공합니다. 새 벤치마크 Wan-Bench 2.0에서 이 모델은 대부분의 핵심 평가 지표에서 주요 상용 모델들을 능가합니다.

Wan2.2-I2V-A14B

I2V-A14B 모델은 이미지-비디오 생성을 위한 모델로, 480P 및 720P 해상도를 지원합니다. 혼합 전문가(MoE) 아키텍처를 기반으로 구축되어, 비현실적인 카메라 움직임을 줄이고 더 안정적인 비디오 합성을 달성하며, 다양한 스타일화된 장면에 대한 강화된 지원을 제공합니다.

Wan2.2-TI2V-5B

TI2V-5B 모델은 16×16×4의 압축 비율을 달성하는 고급 Wan2.2-VAE를 기반으로 구축되었습니다. 이 모델은 720P 해상도, 24fps로 텍스트-비디오 및 이미지-비디오 생성을 지원하며, 4090과 같은 단일 소비자용 GPU에서도 실행 가능합니다. 현재 제공되는 가장 빠른 720P@24fps 모델 중 하나로, 산업용 응용 및 학술 연구 모두의 요구를 충족합니다.

GitHub: https://github.com/Wan-Video/Wan2.2

원래 HuggingFace 저장소: https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/main/split_files/diffusion_models

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.