Wan 2.2 5B - Latent Video Upscaler & Enhancer / Transform Low-Res Videos into HD Masterpieces — The Intelligent Way

详情

模型描述

将低分辨率视频转化为高清杰作——智能方式


简介:超越传统超分辨率

传统的AI超分辨率工具如RealESRGAN在处理图像时表现优异,但在处理视频时往往力不从心。它们可能引入伪影、无法增添有意义的细节,导致画面模糊且不真实。

本工作流 “Wan 2.2 5B - 潜在视频超分辨率器” 实现了范式转变。它不再只是猜测像素,而是借助强大的 Wan 2.2 5B 文本到视频模型,智能地重新诠释并重建你的视频为高清版本。它不只是放大,而是“想象”出缺失的细节,生成比任何传统超分辨率工具更清晰、更细致、更连贯的高清视频。

简而言之:别再用图像超分辨率工具处理视频。使用扩散模型,以智能方式真正增强和提升你的画面细节。


核心功能与亮点

  • 🤖 智能增强: 利用 Wan 2.2 5B 模型添加语义正确的细节、纹理和连贯性,远超传统超分辨率工具的能力。

  • ⚡ 快速高效: 基于轻量级的50亿参数模型,该工作流在潜在空间中进行超分辨率和去噪的速度,显著快于从头生成视频。

  • 🎨 保留画质: 采用轻度处理(denoise=0.2),在增强和放大时不会剧烈改变视频原有的运动或内容。

  • 📈 2倍分辨率提升: 在解码前直接在潜在空间中将输入视频分辨率翻倍。

  • 🎬 流畅最终输出: 可选 RIFE 帧插值 步骤,将帧率从16fps提升至32fps,实现丝滑流畅的最终效果。

  • 🔊 音频透传: 自动将原始视频的音轨保留至最终增强输出。


工作流概述与策略

本工作流是一个复杂的视频处理链条:

  1. 输入: 使用 VHS_LoadVideo 加载你的低分辨率源视频。

  2. 初步放大: 视频立即通过 Lanczos 滤波器 2倍放大 至目标尺寸,为模型提供更好的起点。

  3. 潜在空间处理: 放大后的帧被编码至潜在空间。

  4. 智能增强: 工作流的核心。Wan 2.2 5B 模型 在优质正向提示与细节负向提示引导下,仅用 8步UniPC 算法对潜在变量进行轻微去噪(denoise=0.2)。这一步是“魔法”发生之处——模型填充出合理且高质量的细节。

  5. 解码: 增强后的潜在变量被解码回高分辨率图像序列。

  6. 最终输出:

    • 选项 A: 直接保存16fps的放大视频。

    • 选项 B(推荐): 将序列通过 RIFE VFI 进行帧插值,提升至32fps,生成既高清又极其流畅的最终视频。


技术细节与要求

🧰 所需模型:

  • 基础模型:(GGUF 格式)

    • Wan2.2-TI2V-5B-Q8_0.gguf

    • 来源: 可能来自 HuggingFace 或其他模型仓库。

  • LoRA:

    • Wan2_2_5B_FastWanFullAttn_lora_rank_128_bf16.safetensors(强度设为 0.5
  • VAE:

    • Wan2.2_VAE.safetensors
  • CLIP 视觉编码器:(用于 GGUF 加载器)

    • umt5-xxl-encoder-q4_k_m.gguf
  • 插值模型:

    • rife47.pth(用于 RIFE VFI 节点)

⚙️ 推荐硬件:

  • 建议使用具有充足显存的GPU(例如 12GB+),尤其处理较长视频时更为重要。

🔌 自定义节点:
本工作流使用以下节点:

  • comfyui-videohelpersuite (VHS) — 用于视频加载与合并
  • comfyui-frame-interpolation — 用于 RIFE 帧插值
  • comfyui-gguf / gguf — 用于模型加载
  • comfyui-easy-use — 用于内存管理
  • comfyui-kjnodes — 用于性能优化(Sage Attention)

使用说明

  1. 加载 JSON: 将提供的 .json 文件导入你的 ComfyUI。

  2. 加载模型: 确保所有必需模型位于正确文件夹中,并检查 LoaderGGUFVAELoaderLoraLoaderModelOnly 节点中的路径。

  3. 选择视频:VHS_LoadVideo 节点中,点击视频图标选择你的低分辨率输入视频。

  4. 执行流程: 运行工作流!

  5. 获取输出: 在输出目录中找到两个增强后的视频:

    • .../Wan 2.2 5B Upscales/Denoise 0.2_xxxxx.mp4(16fps)

    • .../Wan 2.2 5B Upscales/Denoise 0.2_32fps_xxxxx.mp4(32fps — 更流畅)


技巧与提示

  • 去噪强度: KSampler 中的 denoise 参数(默认 0.2)是关键。

    • ~0.1–0.3: 最适合超分辨率与增强。在提升画质的同时保留原始内容。

    • >0.5: 将显著改变内容和风格,趋向于基于视频生成全新画面。

  • 源视频质量: 此工作流特别擅长为来自旧生成器的低质量、像素化或噪点严重的视频注入新生机。

  • 提示工程: 正向提示(“high detail, high quality...”)为通用增强设计。如需风格化调整,可修改提示(例如:“cinematic, film grain, photorealism”)。


结论:视频超分辨率的未来

本工作流展示了扩散模型的强大新用途:不仅是生成工具,更是智能增强工具。通过利用 Wan 2.2 模型内部的知识,我们得以实现传统方法无法企及的视频超分辨率——更高的连贯性与细节精度。它比完整生成更快,比简单放大更智能。

上传你的低分辨率片段,亲历智能超分辨率的革命。


致谢: 由 ComfyUI 社区制作。特别感谢 Wan 2.2 模型及 FastWanFullAttn LoRA 的创作者。

此模型生成的图像

未找到图像。