WAN VACE 2.2 | Perfect for IG/TIKTOK | V2V

詳細

ファイルをダウンロード

モデル説明

方向

以下は、私のV2V WAN 2.2 + VACEワークフローのバージョン2です。全体的な動作は以下の通りです。

  1. サブジェクトのリファレンス画像をアップロード(ノード名: ⭐️ Load Image of Reference Subject)

  2. 動画のリファレンスをアップロード(ノード名: ⭐️ Media Selection (Reference Video))

  3. プロンプトを入力

    1. 手動でWanVideo TextEncodeに入力(デフォルト)

    2. SwissArmyKnife LLMノードを使用

      1. Qwen3-VLをLLM Studio経由で使用する場合(ローカルホストモデル)、追加の設定が必要

      2. Gemini APIを使用する場合、APIキーが必要

  4. ワークフローを実行

注意点

サブジェクト/キャラクター

  • 高品質なサブジェクトリファレンス画像を使用してください

    • 私のテストでは、クローズアップが最も効果的です

    • サブジェクトのリファレンス画像の背景は、生成される動画にわずかに影響を与えます

      • WAN VACEと互換性のある方法でサブジェクトのみをマスクする方法は、まだ確立できていません
    • VACEの性質やシードなどの他の変数により、サブジェクトのアイデンティティは完全には維持されません

      • 一貫性が必要な場合は、サブジェクト/キャラクターLoRAを使用するのが最良です
  • 生成された動画が「しすぎ」ている場合は、Fun Reward LoRAの強度を下げてください

LoRAの追加

  • 生成された動画を微調整するために、さらにLoRAを追加できますが、あまりにも多く追加するとLoRA同士が競合し、過剰に焼き付いたような生成結果になります

プロンプトの書き方

  1. サブジェクト:主要なサブジェクトを明確に記述してください——誰または何であるか、何をしているか、どのように見えるか。

  2. 衣装:サブジェクトが着ているもの、または衣装がムード、質感、色、物語にどのように寄与するかに焦点を当ててください。生地、アクセサリー、時代、フィット感の記述を考慮してください。

  3. 動き:サブジェクトの動き、カメラの動き、またはシーン内のダイナミックな要素について詳しく記述してください。役立つ場合は映画的な表現を使用してください。

  4. シーン:環境を定義してください——時間帯、場所、背景/前景の要素、ムード、構図、照明。

  5. ビジュアルスタイル:外観と雰囲気を確立してください——照明、カラーグレーディング、レンズ効果、フィルム種類、リアリズムとスタイル化の程度、そして望まない要素(ネガティブプロンプトの意識)。

このzipファイル内のMarkdownファイルにプロンプトの例を追加しました

NSFW

NSFWの生成は、NSFW LoRAと優れたプロンプトがあれば可能です。高品質なNSFW LoRAが見つかっていないため、本ワークフローには含まれていません。

V1からの主な変更点

  • サブジェクトリファレンス用の画像アップロード機能を追加

  • SwissArmyKnifeカスタムノードのノードミスマッチを修正

  • GeminiからQwen3 VL(ローカルで実行し、Swiss Army Knifeノード経由で公開)に変更

  • SwissArmyKnife LLMノードに依存せず、プロンプト入力のパスを追加

  • VACEエンコーディングノードを再設計・簡素化し、現在はサブジェクトリファレンスと深度マップのみを使用

ロードマップ

  • キャラクターをマスクする方法を確立し、サブジェクトのアイデンティティをよりよく維持し、リファレンス画像の背景が生成動画に過度に影響しないようにする

  • アップスケーリングと補間のためのより良い解決策が必要

  • VACEの「最初のフレーム・最後のフレーム」機能を活用して、より長い動画を生成する

  • NSFW LoRAの設定を最適化

モデルリンク

すべてのモデルはHuggingfaceで入手できます。私はNVIDIA 3090TI(24GB VRAM)と128GB DDR4 RAMを使用しています。FP8_e5m2形式が3000シリーズの生成に最適です。私の環境では生成に約300~500秒かかります。

Diffusionモデル

テキストエンコーダー

VAE

LoRAs

モデル保存場所

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   ├── Wan2_2-T2V-A14B-HIGH_fp8_e5m2_scaled_KJ.safetensors
│   │   ├── Wan2_2-T2V-A14B-LOW_fp8_e5m2_scaled_KJ.safetensors
│   │   ├── Wan2_2_Fun_VACE_module_A14B_HIGH_fp8_e5m2_scaled_KJ.safetensors
│   │   └── Wan2_2_Fun_VACE_module_A14B_LOW_fp8_e5m2_scaled_KJ.safetensors
│   ├── 📂 vae/
│   │   └── Wan2.1_VAE.safetensors
│   ├── 📂 text_encoders/
│   │   └── umt5_xxl_fp16.safetensors
│   └── 📂 loras/
│       ├── Wan22_A14B_T2V_LOW_Lightning_4steps_lora_250928_rank64_fp16.safetensors
│       ├── Wan2.2-Fun-A14B-InP-HIGH-MPS_resized_dynamic_avg_rank_21_bf16.safetensors
│       ├── Wan2.2-Fun-A14B-InP-LOW-MPS_resized_dynamic_avg_rank_22_bf16.safetensors
│       ├── Instagirlv2.5-HIGH.safetensors
│       └── Instagirlv2.5-LOW.safetensors

カスタムノード

ComfyUI-WanVideoWrapper - nightly

comfyui_controlnet_aux - v1.1.2

ComfyUI-Easy-Use - v1.3.4

ComfyUI-KJNodes - v1.1.7

ComfyUI-VideoHelperSuite - v1.7.7

ComfyUI-Frame-Interpolation - v.1.0.7

ComfyUI Video Depth Anything - nightly

CRT-Nodes - v1.8.2

Swiss Army Knife - v2.9.1

ComfyUI

ComfyUI - v0.3.65

ComfyUI_frontend - v1.27.10

Python - v3.12.3

Pytorch - 2.9.0+cu128

このモデルで生成された画像

画像が見つかりません。