Wan 2.2 - I2V - XT-404 - Master UI
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
これは私の個人的なワークフローであり、モデルやノードの作成には一切責任を負いません!!
以下に説明されているノードとモデルを使用してください!!
ノード > https://github.com/XT-404/XT-404_SKYNET
Lora Loader https://github.com/HenkDz/rgthree-comfy
モデル > https://civarchive.com/models/2244942?modelVersionId=2527274
🤖 XT-404 Skynet Suite: Wan 2.2 統合
ComfyUI のための「オメガエディション」
XT-404 Skynet Suite は、ComfyUI 用に特化し、実戦で検証されたカスタムノードのコレクションであり、特に Wan 2.1 および 2.2 動画ディフュージョンモデル向けに設計されています。
標準的なノードとは異なり、このスイートは「ビジュアルの優位性」を追求します。数学的な精密さで 8K、OLED 級のクオリティを実現します。汎用的な処理を廃止し、シグナルの整合性を保護し、VRAM を外科的に管理し、デジタルアーティファクトを排除するヒューリスティックでコンテキスト認識型のアルゴリズムを使用します。
⚠️ 必要条件
ComfyUI: 最新バージョンを推奨します。
Wan 2.2 モデル: VAE、CLIP、UNet/Transformer モデルを必ずご用意ください。
Python: 3.10+
FFmpeg: Compressor ノードに必要(通常は
imageio-ffmpeg経由)。
注意
インフィルトレーションプロトコル(GGUF): Cyberdyne Model Hub で GGUF クアンタイズモデルを使用するには、ComfyUI-GGUF エンジンが必須です。📥 エンジンのダウンロード: city96/ComfyUI-GGUF このエンジンがなければ、Cyberdyne Model Hub は Safetensors のみモードで動作します。
🚀 主な機能
ゼロポイントノイズ注入: 動画生成時の「静電ノイズ」を排除します。
ARRI ロールオフトーンマッピング: 高コントラストシーンでも白飛びを防止します。
ナノリペア(Genisys): TF32 精度によるブラックスクリーン/NaN を防ぐため、テンソルをリアルタイム監視します。
OLED/8K ワークフロー: 深いブラック、有機的な粒状、マイクロディテールの幻覚を実現する専用パイプライン。
センチネルテレメトリー: リアルタイムコンソールログ(「The Mouchard」)が、ステップごとの彩度、白飛び、VRAM 使用量を分析します。
📦 インストール
ComfyUI のカスタムノードディレクトリに移動してください:
cd ComfyUI/custom_nodes/
このリポジトリをクローンしてください:
git clone https://github.com/YourUsername/XT-404-Skynet-Suite.git
必要なパッケージをインストール:
pip install imageio-ffmpeg scikit-image
🛠️ モジュールの構成
1. コアエンジン(XT404_Skynet_Nodes.py)
生成プロセスの中心です。標準の KSamplers を、Wan の Flow Matching 用に最適化されたハイブリッドエンジンで置き換えます。
ゼロポイント修正:
0 + ノイズ = 純粋なノイズを保証し、注入前に潜在空間をクリアします。Wan シグマ計算機: Wan 2.1/2.2 に必要な特定のシフト式を使用します。
チェーンアーキテクチャ: マスターのシグマクロックをノード間で渡すことで「Hires Fix」を実現します。
2. ユニバーサルローダー(cyberdyne_model_hub.py)
チェックポイント、SafeTensors、GGUF モデルを統合して読み込むローダーです。
再帰的検索: サブディレクトリ内のモデルを自動的に検出します。
GGUF 委譲: GGUF ファイルを検出し、適切なバックエンドにルーティングします。
スマートオフロード: 未使用モデルを積極的に RAM にオフロードし、サンプラー用の VRAM を確保します。
3. ビジュアル優位性スイート(wan_visual_supremacy.py)
「AI プラスチック感」を克服する「秘密のレシピ」です。
Latent Detailer X: 復号前にマイクロディテールを注入しつつ、シグナルの飽和を防止します。
Temporal Lock Pro: 復号後の安定化ツールで、低差分フレームをブレンドし、フラッカーを排除します。
OLED Dynamix(ARRI ロールオフ): ハイライトのテクスチャを保持する対数圧縮カーブです。
4. ナノリペアシステム(wan_genisys.py)
ノード:
Cyberdyne Genisys [OMNISCIENT]機能: TF32/BF16 における「ブラックスクリーン」問題を解決。テンソルのドリフトを計算し、NaN に到達する前に値をクランプします。
5. T-X インターポレーター(wan_tx_node.py)
機能: スタート画像とエンド画像の間で動画を生成します。
革新: 単純なブレンドではなく、逆構造反発 を使用して、モデルが変換パスを幻覚させるように強制します。
🎛️ 推奨ワークフローストラテジー
究極の 8K OLED ルックを得るには、以下の順序でノードをチェーンしてください:
ローダー:
Cyberdyne Model Hub(モデルとVAEを読み込み)プロンプト:
Wan Text CacheおよびWan Vision Cache生成:
WanImageToVideoUltra→XT-404 Skynet 1 (Master)精緻化:
XT-404 Skynet 3 (Refiner)(ノイズ除去 0.3)復号:
VAE Decodeビジュアル優位性スタック:
Temporal Lock Pro(ピクセルを安定化)OLED Dynamix(光をスカルプト)Organic Skin(テクスチャを追加)
最終仕上げ:
Wan Chroma Mimic(シグナルを検証しシャープネスを調整)エンコード:
Video Combine→Wan Compressor
📟 コンソール HUD(XT-Mouchard)
コンソールを無視しないでください!このスイートはシグナルの健康状態を伝達します:
🟢 グリーン: シグナルは正常です。
🟡 イエロー: 高シグナルが検出されました(ロールオフが有効)。
🔴 レッド: 致命的な飽和/白飛び(
specular_popを下げてください)。
例:
[XT-MIMIC] 🎨 FINAL VALIDATION | DynRange: [0.000, 0.982]
└── Signal Integrity: OK (Clip: 0.00%)
これは、数学的に完璧なブラックとホワイトを 98.2% で制限し、ディスプレイのブロームを許容することを意味します。
📜 クレジット
アーキテクト: XT-404 Omega
企業: Cyberdyne Systems
ステータス: GOLD MASTER (V3.8)
"運命など存在しない。我々が作り出すものだけが真の運命だ。"
Cyberdyne Research Division が管理しています。「インフィルトレーションレポート」は issue でご連絡ください。
🤖 XT-404 Skynet : Wan 2.2 Sentinel Suite (OMEGA EDITION)
Cyberdyne Systems Corp. | Series T-800 | Model 101
"未来は決まっていない。我々自身が作り出すものだけが真の運命だ。"
⚠️ クリティカルなシステム依存
注意
インフィルトレーションプロトコル(GGUF): Cyberdyne Model Hub で GGUF クアンタイズモデルを使用するには、ComfyUI-GGUF エンジンが必須です。
📥 エンジンのダウンロード: city96/ComfyUI-GGUF
このエンジンがなければ、Cyberdyne Model Hub は Safetensors のみモードで動作します。
🚀 なぜ XT-404 Skynet を選ぶのか?(競合分析)
標準ノードは汎用的な実装に依存します。XT-404 Skynet は、Wan 2.2 の特異性に特化してカスタム設計されたアーキテクチャです。
| 機能 | 標準ノード/競合 | 🤖 XT-404 Skynet アーキテクチャ |
|---|---|---|
| 精度 | 標準 FP16/BF16(バンドリング発生) | ハイブリッド FP32/TF32 コンテキストスイッチング(バンドリングゼロ) |
| インターポレーション | 単純な線形フェード(静的/凍結) | T-X デュアルフェーズラッパー(ネイティブVAE注入) |
| カラーサイエンス | RGB クリッピング | LAB スペース変換 & OLED Dynamics(シネマグレード) |
| キャッシング | 基本的な TeaCache(モーションフリーズリスク) | T-3000 Genisys(運動量 & ナノリペア搭載) |
| スケーリング | ビリニア(ぼやけ) | Lanczos/Bicubic FP32(ピクセルパーフェクト) |
| メモリ | 高VRAM使用(OOMリスク) | 外科的ピン留めメモリ(DMA) & 激しいプルージュ |
🌍 ニューラルネットナビゲーション
🇺🇸 英語ドキュメント
🇫🇷 フランス語ドキュメント
詳細な技術情報をご確認ください。
🇺🇸 英語ドキュメント
🎨 フェーズ0:ビジュアルエンジニアリング(Wan Chroma Mimic)
ファイル: wan_chroma_mimic.py
究極のカラーグレーディングエンジン。 単なるフィルターではありません。これはGPU上でリアルタイムで動作し、画像テンソルをLAB色空間に変換して、明るさと色情報を分離し、照明データを破壊せずにシネマグレードのリファレンスを可能にします。
🔥 主な機能と設定
アーキテクチャ: 100% PyTorch GPU。0% CPU遅延。
形態学フィルター: 動画ディフュージョンで発生するマイクロアーティファクト(黒白ドット)を拡大する前に除去します。
OLED Dynamics: 0.5を中心に非線形のSカーブを適用し、ブラックを深めつつハイライトを保持します。
パラメータ 推奨値 説明reference_image 必須 ソース画像(スタイルの参照)。ムードはここから抽出されます。effect_intensity 0.25 LAB変換のブレンド強度。oled_contrast 0.00 「Netflix」スタイル。 ダイナミックレンジを強化。0.0 = ニュートラル。skin_metal_smooth 0.25 スマートサーフェスブラー。 皮膚・金属を滑らかにし、エッジを検出してシャープネスを保持。detail_crispness 0.2 シネマ・ピケ。 差分ガウシアン法でマイクロディテールを強調。
🛡️ フェーズ1:浸透(Cyberdyneモデルハブ)
ファイル: cyberdyne_model_hub.py
SafetensorsとGGUFアーキテクチャを統合するローダー。Wan 2.2の「デュアルUNet」要件を自動的に解決します。
- 再帰的スキャナー: サブフォルダ内にモデルを検出。
- Skynetプロトコル: アクティブなVRAM管理。読み込み前にチェックサム(SHA256)を計算し、メモリ断片化を防ぐためにメモリを解放。
- ハイブリッドローディング: 高解像度FP16モデルと低解像度GGUFモデルを同時に読み込み可能。
🧠 フェーズ2:ニューラルネットコア(XT-404サンプラー)
ファイル: XT404_Skynet_Nodes.py
「Sentinel」エンジン。標準サンプラーとは異なり、Wan 2.2に必要なsimple(線形)スケジューラーがハードコードされており、標準KSamplersで見られる「焼き付き出力」の問題を回避。
🔴 XT-404 Skynet 1(マスター)
- シフト値(5.0): Wan 2.2の潜在タイムリングにおける重要な設定。
- Bongmathエンジン: カスタムテクスチャノイズ注入システム。
True:アナログフィルムグレインの整合性を追加。False:純粋なデジタルクリーンさ。
🟡 XT-404 Skynet 2(チェーン)
- シードロック:
options辞書を介してマスターノードのシードを自動的に継承。生成パス間で時間的一貫性を確保。
🟢 XT-404 Skynet 3(リファイナー)
- リサンプルモード: チェーンの最後に制御されたノイズを注入し、高周波ディテールを空想的に生成。
💀 フェーズ3:T-3000 Genisys(全知キャッシュ)
ファイル: wan_genisys.py
TeaCacheより優れている。 標準のTeaCacheは差が低すぎると動画の動きをフリーズさせます。T-3000は「運動モメンタム」を使用。
- 運動モメンタム: 動きが検出された場合、次のXフレームの計算を強制し、「マネキンチャレンジ」効果を回避。
- ナノ修復: テンソルストリーム内の
NaNまたはInf値(黒画面バグ)を検出し、ハードクリッピングではなくソフトクランプ(-10/+10)で外科的に修復。 - HUD: コンソールにリアルタイムの信号整合性とドリフト指標を表示。
🎭 フェーズ4:模倣レンダリング(I2V Ultra & フィデリティ)
ファイル: nodes_wan_ultra.py / wan_fast.py
🌟 Wan Ultra(クオリティの王)
- 核融合正規化: Bicubic-AntiAliasを使用して入力画像を厳密に0.0–1.0の範囲に整備。
- ディテールブースト: VAEエンコード前にシャープニング畳み込み行列を適用し、圧縮ぼやけを補正。
- モーションアンプ: 「ソフトリミッター」(Tanhカーブ)を使用して、物理法則を破ることなくモーションベクトルを増幅。
⚡ Wan Fidelity(スピードの王)
- 最適化: メモリ効率を高めるため、連結ではなく
torch.fullを使用。 - ロジック: 完全な時間的整合性を実現するため、元のWan 2.1のコンテキストウィンドウロジックを復元。
🧪 フェーズ6.5:ポリメトリック合金(T-Xデュアルフェーズ)[新規]
ファイル: wan_tx_node.py
補間特異点。 標準のI2Vモデルは特定の最終フレームに到達するのが困難(しばしばフリーズまたはスタイルを失う)。T-XエンジンはネイティブVAE注入ラッパーを使用してタイムラインを完璧にブリッジ。
- キーフレーム注入: 潜在空間を破損することなく、[開始フレーム → 空の虚無 → 終了フレーム]をエンコードするためにVAEの内部ロジックを一時的に上書き。
- 流動的モーフィング: Wan 2.2モデルに点Aと点Bの間の物理方程式を解かせ、「スライドショー」効果を回避。
- スマートVRAMスキャナー: GPU容量を自動検出し、「セーフ」(512pxタイリング)と「ウルトラ」(1280pxタイリング)モードを切り替え。
パラメータ 説明start_image 開始フレーム(フレーム0)。end_image 目標フレーム(フレームN)。T-Xエンジンはこの画像への収束を強制。motion_amp キーフレーム間の潜在モーションベクトルを増幅。detail_boost VAE圧縮中にテクスチャを保持するための前処理シャープニング。
⚡ フェーズ5:センサー & アクセラレーター(Omegaツール)
🚀 Wanハードウェアアクセラレーター(Anti-Burn V4)
ファイル: wan_accelerator.py パフォーマンスの「隠し味」。
- 問題: Wan 2.2でTF32を有効にすると、正規化エラーにより画像が「焼け」(コントラスト問題)を起こす。
- 解決策(コンテキストスイッチング): このノードは速度のためにTF32をグローバルに有効にしますが、
GroupNormとLayerNormレイヤーをインターセプトしてFP32精度に強制。 - 結果: TF32の30%速度向上と、FP32のビジュアル品質を両立。
👁️ Wanビジョン&テキストキャッシュ(DMA)
ファイル: wan_i2v_tools.py
- ピン止めメモリ: テキスト埋め込みをCPUページロックメモリ(DMA)でGPUに即座に転送。
- ビジョンハッシュ: 画像コンテンツ(ストライドを含む)をハッシュ化し、同じCLIPビジョン入力を再エンコードしないように。
🛠️ フェーズ6:ポストプロセッシング & 自動化
- Wanコンプレッサー(Omega): スレッドセーフなH.265エンコード。CPUスレッドを16に制限し、Threadripper/i9のクラッシュを回避。
- Wanサイクルターミネーター: Windows APIの
EmptyWorkingSetを使用してRAMスタンバイリストをフラッシュ(OSの立ち往生を防止)。 - Auto Wanオプティマイザー: スマートリサイズ。Wanに必要な
Modulo 16の寸法を強制し、OOM(>1024px)を回避。

