MOTION-FORGE Wan 2.2 14B 4 Steps MoE I2V Noob-Friendly

詳細

ファイルをダウンロード

モデル説明

Wan 2.2 14B MoEを基盤とした、シームレスな画像から動画へのワークフロー。単一の参照画像から、鮮明な動きと安定したディテールを実現するため、高ノイズ/低ノイズのデュアルエキスパートを搭載。Positive/Negative CLIPプロンプトがWanImageToVideoでモーションプランニングを条件付け、その後WanMoeKSamplerが高ノイズと低ノイズのトラックをブレンドし、ダイナミックかつ一貫性のあるディノイジングを実現。このパイプラインはネイティブで16 FPSの動画をエクスポートし、オプションでRealESRGANによるx2アップスケーリングとRIFE補間を適用することで32 FPSのソーシャル対応出力が可能。

主な特徴

  • WanMoeKSamplerによる高ノイズ・低ノイズモデルのデュアルエキスパートサンプリングで、モーションエネルギーとディテールの安定性を実現。

  • 参照画像のサイズを自動で継承し、アスペクト比の歪みを回避して設定を簡素化。

  • ポストスタック:VAEDecodeでフレーム化 → CreateVideoでMP4作成 → オプションでRealESRGANによるアップスケーリング → RIFEによるx10テンポラル補間。

入力

  • 参照画像ローダー、Positive/Negative CLIPプロンプト、オプションでWriterによるオーディオパストルー。

  • デフォルト:960×960、長さ65フレーム、ベース16 FPS。

推奨設定

  • サンプラー:UniPC + Betaスケジューラ、ステップ数4–5、ディノイズ1.0、バウンダリー0.5、シグマシフト5。

  • LoRA:LightX2V 高ノイズ強度5.6、低ノイズ強度2.0。

各モデルの配置場所

  • ディフュージョンモデル(GGUF):

    • Wan2.2-I2V-A14B-HighNoise-Q8_0.gguf — LoaderGGUFによって読み込まれ、高ノイズブランチにルーティング。GGUFローダーが使用するmodelsフォルダ内に配置。

    • Wan2.2-I2V-A14B-LowNoise-Q8_0.gguf — LoaderGGUFによって読み込まれ、低ノイズブランチにルーティング。上記と同じmodelsフォルダ内に配置。

  • VAE:pig_wan_vae_fp32-f16.gguf — VaeGGUFによって読み込まれ、WanImageToVideoとVAEDecodeに接続。models/vaeフォルダ内に配置。

  • CLIPテキストエンコーダー:cow-umt5xxl-q8_0.gguf — ClipLoaderGGUFによって読み込まれ、ビジョンは“wan”、投影は“default”に設定。models/clipフォルダ内に配置。

  • LoRA:wan_loras/lightx2v_I2V_14B_480p_cfg_step_distill_rank128_bf16.safetensors — 各ブランチでLoraLoaderModelOnlyによって読み込まれ、Power Lora Loaderに接続。models/loras/wan_lorasフォルダ内に配置。

  • アップスケーラー:RealESRGAN_x2plus.pth — UpscaleModelLoader経由でImageUpscaleWithModelに接続。models/upscale_modelsフォルダ内に配置。

  • フレーム補間:rife49.pth — RIFE VFIノードでファクター10、スケール2と共に使用。models/rifeフォルダ内に配置。

ノードの特徴

  • WanImageToVideo:指定された幅・高さ・長さで、画像とプロンプトから潜在変数を準備。

  • WanMoeKSampler:各ブランチでCFGを適用し、高・低エキスパートをブレンドして品質を制御。

  • CreateVideo:16 FPSでの動画組立。RIFE後には2番目のWriterを使用して32 FPSをエクスポート。

  • ユーティリティ:制限されたVRAM環境での長時間実行を安定化させるため、複数のcleanGpuUsedおよびRAMCleanupノードを備える。

このモデルで生成された画像

画像が見つかりません。