Wan Video 2.1
wan2.1_t2v_14B_fp8_e4m3fnwan2.1_i2v_720p_14B_fp8wan2.1_i2v_480p_14B_fp8wan2.1_t2v_1.3B_fp16Wan 2.1 VAEClip Vision humt5_xxl_fp8_e4m3fn_scale
详情
下载文件
模型描述
Wan Video
注意:Civitai 上还托管了其他 Wan Video 文件——这些可能是重复文件,但本模型卡主要用于托管 Wan Video 在 Civitai 生成器中使用的文件。
👍 SOTA 性能:Wan2.1 在多个基准测试中始终优于现有的开源模型和领先的商业解决方案。
👍 支持消费级 GPU:T2V-1.3B 模型仅需 8.19 GB 显存,兼容几乎所有的消费级 GPU。在 RTX 4090 上,无需量化等优化技术,即可在约 4 分钟内生成一段 5 秒的 480P 视频,其性能甚至可与部分闭源模型相媲美。
👍 多任务支持:Wan2.1 在文本到视频、图像到视频、视频编辑、文本到图像以及视频到音频等任务中表现卓越,推动了视频生成领域的发展。
👍 视觉文本生成:Wan2.1 是首个能够生成中英文文本的视频模型,具备强大的文本生成能力,显著提升了其实际应用价值。
👍 强大的视频 VAE:Wan-VAE 具备卓越的效率与性能,可高效编码和解码任意长度的 1080P 视频,同时保留时序信息,是视频与图像生成的理想基础架构。
原始 HuggingFace 仓库:https://huggingface.co/Wan-AI
