Wan2.1 SkyReelsV2 VACE 14B T2V I2V Extend & Loop
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
Wan2.1 SkyReelsV2 VACEワークフロー(MoviiGen AccVid CausVid FusionX LoRAsと組み合わせてテスト済み)(14B T2V、リファレンス I2V、拡張&ループ対応)
このComfyUIワークフローは以下の機能をサポートします:
- SkyReels-V2-VACE-GGUFを使用した**画像から動画(I2V)およびループ可能な動画拡張(V2V)**の生成
- AccVidおよびCausVid LoRAを2つのサンプラーと組み合わせて、生成速度を向上
- MoviiGenおよびRewards LoRAを使用して、品質を向上
以下のように利用できます:
- 最初の動画を起点として生成
- 1つずつ動画を拡張して、最終的なシーケンスを段階的に構築
- 最終カット用に最適なセグメントを選択(チェリーピッキング)
- シーンや動きの変化に合わせてプロンプトを段階的に最適化
🔧 コンポーネント
🌀 SkyReels-V2-VACE-GGUF (by wsbagnsv1)
- Wan2.1をベースとし、720p@24fpsの動画でファインチューニング
- 統合された**VACE(All-in-One Video Creation and Editing framework)**により、リファレンス動画を使ってモーション制御(動画用ControlNetのような機能)
- ComfyUIでGGUF形式によるネイティブ対応
- 全シーケンスにわたり時間的一貫性を維持
⚡ LoRAモデル
速度
- CausVid v2, https://huggingface.co/Kijai/WanVideo_comfy/blob/main/Wan21_CausVid_14B_T2V_lora_rank32_v2.safetensors
- AccVid, https://huggingface.co/Kijai/WanVideo_comfy/blob/main/Wan21_AccVid_T2V_14B_lora_rank32_fp16.safetensors
品質
- MoviiGen, https://huggingface.co/Kijai/WanVideo_comfy/blob/main/Wan21_T2V_14B_MoviiGen_lora_rank32_fp16.safetensors
- MPS, https://huggingface.co/alibaba-pai/Wan2.1-Fun-Reward-LoRAs/blob/main/Wan2.1-Fun-14B-InP-MPS.safetensors
- HPS, https://huggingface.co/alibaba-pai/Wan2.1-Fun-Reward-LoRAs/blob/main/Wan2.1-Fun-14B-InP-HPS2.1.safetensors
すべてを統合
- FusionX, /model/1678575(VACE対応T2V)
▶️ 使用方法
🖼️ 画像を最初のフレームとして動画を生成する場合
- ミューターノードで**「First Frame」**を有効化
- 入力画像をアップロード
- 生成パラメータを設定:
- プロンプト(ポジティブ/ネガティブ)
- Shift
- Steps
- Seed
- 幅/高さ
- 長さ(フレーム数)
- サンプラー
- スケジューラ
- Runをクリック
🎥 既存の動画を拡張またはループする場合
- **「Video Extension」または「Video Loop」**オプションを有効化
- 入力動画をアップロードまたは選択(最適な品質のため、アニメーションWebP形式でLoad Imageノード経由)
- 拡張パラメータを設定:
- オーバーラップフレーム数
- 拡張フレーム数
- プロンプト(ポジティブ/ネガティブ)
- Shift
- Steps
- Seed
- サンプラー
- スケジューラ
- Runをクリック
継続フレーム数(必要に応じて調整)
- オーバーラップフレーム:元のアニメーションから継承するフレーム数
- 値を大きくすると、時間的一貫性が向上し、前のセグメントの流れを維持
- 値を小さくすると、移行が急激になり、動き、テンポ、方向が不自然に変化する可能性
- 拡張フレーム:現在のアニメーションの後に生成する新規フレーム数
⚠️ 課題と制限
ベースモデルはT2Vモデルであり、真のI2Vモデルではありません。
I2Vは、リファレンス画像をVACEノードに渡すことで実現されており、画像そのものを厳密に保持するものではありません。
真のI2Vモデルでは、入力画像が正確な最初のフレームとして保持されます。
ここでは、VACEは画像を曖昧なガイドとして扱い、厳密な視覚的保持は行いません。
例:
- 入力画像にオブジェクトが欠けていても、プロンプトに含まれていれば、そのオブジェクトが最初のフレームに追加される可能性
- プロンプトが画像と矛盾している場合、元の要素が欠損することがある
- 細部の品質は時間が経つにつれて劣化し、特に長時間拡張動画で顕著
📂 参照
- SkyReels V2 + VACE 概要(Reddit)
- MoviiGen + VACE 概要(Reddit)
- causvid wan img2vid - 2つのサンプラーを直列で使用したモーション改善(Reddit)
- VACEの例(HuggingFace)
- SkyReels Diffusion拡張例(GitHub)
- VACE拡張はFLF2Vを超える次世代技術(Reddit)
- Wan2.1 VACEで何でもループ(Reddit)
FAQ(よくある質問)
❓ 16GB VRAMで実行できますか?
はい。私は16GB VRAM搭載のRTX 5060 TiでQ6_K GGUFモデルを使用して実行しました。
GGUFモデルでは、GPUメモリに合わせてバージョンを選択できます:
- Q3_X_X(3-bit):約8GB VRAM
- Q4_X_X(4-bit):約12GB
- Q5–Q6:約16GB
- Q8:約24GB以上
👉 モデルおよびハードウェア情報:https://huggingface.co/QuantStack/SkyReels-V2-T2V-14B-720P-VACE-GGUF
❓ エラーまたは不良動画が出る理由は?
このワークフローは実験段階のため、クラッシュや品質低下は一般的です。以下にヒントを提示:
- OOM(メモリ不足)エラー:GPUのVRAMが不足
- 低量子化モデル(例:Q3またはQ4)を使用してメモリ使用量を削減
- 動画の解像度または長さを下げて過負荷を回避
- 移行が不自然な場合、プロンプトやその他の設定を調整
- 複数回生成して、最良のクリップを組み合わせる
❓ 特定の解像度でエラーが出る理由は?
**「WanVaceToVideo」**ノードは、幅と高さがいずれも16で割り切れる解像度のみを受け入れます。この条件を満たさない入力解像度では、エラーまたは処理失敗が発生します。
以下は、一般的なアスペクト比に基づいた推奨解像度(標準出力高さ:320、368、480、544、640、720)です:
✅ 推奨アスペクト比と解像度(すべて16で割り切れる値)
- 🖥 32:9 → 1136x320
- 📽 21:9 → 752x320、864×368、1120×480、1264×544
- 🖼 2:1 → 640x320、736×368、960×480、1088×544、1280×640
- 📺 16:9 → 576x320、656×368、832×480、960×544、1136×640、1280×720
- 🖥 16:10 → 512x320、592×368、768×480、864×544、1024×640、1152×720
- 📷 3:2 → 480x320、560×368、720×480、816×544、960×640、1088×720
- 🖼 4:3 → 432x320、496×368、640×480、720×544、848×640、960×720
- 🖼 5:4 → 400x320、464×368、608×480、688×544、800×640、896×720
❓ 画像のアップロード時に「Request Entity Too Large」エラーが発生した場合、どうすればよいですか?
このエラーは、ファイルサイズがアップロード制限を超えた場合に発生します。対処法:
- WebPファイルを直接
ComfyUI\inputフォルダに配置 - ComfyUIで**Reload(R)**を押してファイル一覧を更新
- 「ファイルを選択してアップロード」ではなく、Load Imageノードを使ってファイルを選択
