Wan 2.2 5B - Latent Video Upscaler & Enhancer / Transform Low-Res Videos into HD Masterpieces — The Intelligent Way

詳細

ファイルをダウンロード

モデル説明

低解像度動画をHDの傑作に変換 — 智能的な方法


導入:従来のアップスケーリングを超えて

RealESRGANなどの従来のAIアップスケーラーは画像には優れていますが、動画にはしばしば対応できません。アーチファクトを生み出し、意味のあるディテールを追加できず、映像をぼやけた不自然な状態のまま残してしまうことがあります。

このワークフロー**「Wan 2.2 5B - Latent Video Upscaler」は、パラダイムの転換をもたらします。ピクセルを推測するだけではなく、Wan 2.2 5B テキスト→動画モデルの強力な能力を活用し、動画を高解像度で智能的に再解釈・再構築**します。単に拡大するのではなく、欠けたディテールを「夢見て」補完するため、従来のアップスケーラーでは決して実現できない、よりクリーンで詳細かつ一貫性のあるHD動画を生成します。

TL;DR:動画には画像用アップスケーラーを使わないでください。拡散モデルを使って、知的かつ正確なディテールで映像を真正に強化・アップスケールしましょう。


主な特徴とハイライト

  • 🤖 智能的強化: Wan 2.2 5Bモデルを活用し、意味的に正しいディテール、テクスチャ、一貫性を追加。従来のアップスケーラーをはるかに凌駕します。

  • ⚡ 高速かつ効率的: 軽量な5Bパラメータモデルに基づき、latentアップスケーリングとノイズ除去を、ゼロから生成するよりもはるかに高速に実行します。

  • 🎨 品質の保持: 軽度のノイズ除去(denoise=0.2)を適用し、動画の元の動きやコンテンツを大幅に変更することなく強化・アップスケールします。

  • 📈 2倍解像度向上: 復号前にlatent空間で入力動画の解像度を直接2倍にします。

  • 🎬 滑らかな最終出力: オプションでRIFEフレーム補間を追加し、フレームレートを16fpsから32fpsに倍増。最終レンダリングでなめらかな動きを実現します。

  • 🔊 オーディオ透過: ソース動画の元のオーディオトラックを自動的に最終出力に引き継ぎます。


ワークフロー概要と戦略

このワークフローは洗練された動画処理チェーンです:

  1. 入力: VHS_LoadVideoを使用して低解像度のソース動画を読み込みます。

  2. 初期アップスケール: ビデオはすぐにLanczosフィルターで2倍にアップスケールされ、モデルの理想的な入力サイズを確保します。

  3. Latent処理: アップスケールされたフレームをlatent空間にエンコードします。

  4. 智能的強化: ワークフローの核となる工程。Wan 2.2 5Bモデルは、品質ポジティブおよびディテールネガティブのプロンプトに導かれ、UniPCを用いてわずか8ステップdenoise=0.2でlatentを穏やかにノイズ除去します。このステップで「マジック」が起きます—モデルが妥当で高品質なディテールを補完します。

  5. デコード: 強化されたlatentを高解像度の画像シーケンスへデコードします。

  6. 最終出力:

    • オプションA: 16fpsで即時アップスケールされた動画を保存。

    • オプションB(推奨): シーケンスをRIFE VFIに通してフレームを補間し、32fpsの最終動画を作成。高解像度かつ超滑らかになります。


技術的詳細と要件

🧰 必要なモデル:

  • ベースモデル:(GGUF形式)

    • Wan2.2-TI2V-5B-Q8_0.gguf

    • ソース: おそらくHuggingFaceまたは他のモデルリポジトリから。

  • LoRA:

    • Wan2_2_5B_FastWanFullAttn_lora_rank_128_bf16.safetensors(強度0.5で適用)
  • VAE:

    • Wan2.2_VAE.safetensors
  • CLIP Vision:(GGUFローダー用)

    • umt5-xxl-encoder-q4_k_m.gguf
  • 補間モデル:

    • rife47.pth(RIFE VFIノード用)

⚙️ 推奨ハードウェア:

  • 良好なVRAM(例:12GB以上)を備えたGPUを推奨。特に長い動画を処理する場合に重要です。

🔌 カスタムノード:
このワークフローでは以下を使用:

  • comfyui-videohelpersuite(VHS)— 動画読み込み・統合用

  • comfyui-frame-interpolation— RIFE VFI用

  • comfyui-gguf / gguf— モデル読み込み用

  • comfyui-easy-use— メモリ管理用

  • comfyui-kjnodes— パフォーマンスパッチ(Sage Attention)用


使用方法

  1. JSONを読み込む: 提供された.jsonファイルをComfyUIにインポートします。

  2. モデルを読み込む: すべての必要なモデルが正しくフォルダに配置されていることを確認。LoaderGGUFVAELoaderLoraLoaderModelOnlyノードのパスをチェックしてください。

  3. 動画を選択: VHS_LoadVideoノードで、ビデオアイコンをクリックして低解像度の入力動画を選択します。

  4. プロンプトを実行: ワークフローを実行!

  5. 出力を取得: 出力ディレクトリで2つの強化動画を見つけます:

    • .../Wan 2.2 5B Upscales/Denoise 0.2_xxxxx.mp4(16fps)

    • .../Wan 2.2 5B Upscales/Denoise 0.2_32fps_xxxxx.mp4(32fps — より滑らか)


ヒントとコツ

  • ノイズ除去強度: KSamplerのdenoiseパラメータ(デフォルト0.2)が鍵です。

    • ~0.1–0.3: アップスケーリング・強化に最適。元のコンテンツを保持しつつ品質を向上。

    • >0.5: コンテンツやスタイルを大幅に変更し、動画に基づく新規生成に近づきます。

  • ソース品質: このワークフローは、古い生成器からの低品質・ピクセル化・ノイズの多い動画に新たな命を吹き込むのに優れています。

  • プロンプト設計: ポジティブプロンプト(high detail, high quality...)は一般に強化を促すよう設定されています。スタイル変更にはこのプロンプトを変更できます(例:cinematic, film grain, photorealism)。


結論:動画アップスケーリングの未来

このワークフローは、拡散モデルの強力な新用途を示しています:単なる生成ツールではなく、知的強化ツールとしての活用です。Wan 2.2モデルが持つ知識を活用することで、従来の手法では決して実現できないレベルの整合性とディテールで動画をアップスケールできます。完全生成よりも高速であり、単純な拡大よりも賢明です。

低解像度クリップをアップロードし、知的アップスケーリングの革命を体感してください。


クレジット: ComfyUIコミュニティによって制作。Wan 2.2モデルとFastWanFullAttn LoRAの作者に特別な感謝を。

このモデルで生成された画像

画像が見つかりません。