Wan 2.2 - I2V - XT-404 - Master UI

詳細

ファイルをダウンロード

モデル説明

これは私の個人的なワークフローであり、モデルやノードの作成には一切責任を負いません!!
以下に説明されているノードとモデルを使用してください!!

ノード > https://github.com/XT-404/XT-404_SKYNET

Lora Loader https://github.com/HenkDz/rgthree-comfy

モデル > https://civarchive.com/models/2244942?modelVersionId=2527274

🤖 XT-404 Skynet Suite: Wan 2.2 統合

ComfyUI のための「オメガエディション」

Skynet Banner Version Architecture License

XT-404 Skynet Suite は、ComfyUI 用に特化し、実戦で検証されたカスタムノードのコレクションであり、特に Wan 2.1 および 2.2 動画ディフュージョンモデル向けに設計されています。

標準的なノードとは異なり、このスイートは「ビジュアルの優位性」を追求します。数学的な精密さで 8K、OLED 級のクオリティを実現します。汎用的な処理を廃止し、シグナルの整合性を保護し、VRAM を外科的に管理し、デジタルアーティファクトを排除するヒューリスティックでコンテキスト認識型のアルゴリズムを使用します。


⚠️ 必要条件

  • ComfyUI: 最新バージョンを推奨します。

  • Wan 2.2 モデル: VAE、CLIP、UNet/Transformer モデルを必ずご用意ください。

  • Python: 3.10+

  • FFmpeg: Compressor ノードに必要(通常は imageio-ffmpeg 経由)。

注意

インフィルトレーションプロトコル(GGUF): Cyberdyne Model Hub で GGUF クアンタイズモデルを使用するには、ComfyUI-GGUF エンジンが必須です。📥 エンジンのダウンロード: city96/ComfyUI-GGUF このエンジンがなければ、Cyberdyne Model Hub は Safetensors のみモードで動作します。


🚀 主な機能

  • ゼロポイントノイズ注入: 動画生成時の「静電ノイズ」を排除します。

  • ARRI ロールオフトーンマッピング: 高コントラストシーンでも白飛びを防止します。

  • ナノリペア(Genisys): TF32 精度によるブラックスクリーン/NaN を防ぐため、テンソルをリアルタイム監視します。

  • OLED/8K ワークフロー: 深いブラック、有機的な粒状、マイクロディテールの幻覚を実現する専用パイプライン。

  • センチネルテレメトリー: リアルタイムコンソールログ(「The Mouchard」)が、ステップごとの彩度、白飛び、VRAM 使用量を分析します。


📦 インストール

ComfyUI のカスタムノードディレクトリに移動してください:

cd ComfyUI/custom_nodes/

このリポジトリをクローンしてください:

git clone https://github.com/YourUsername/XT-404-Skynet-Suite.git

必要なパッケージをインストール:

pip install imageio-ffmpeg scikit-image

🛠️ モジュールの構成

1. コアエンジン(XT404_Skynet_Nodes.py

生成プロセスの中心です。標準の KSamplers を、Wan の Flow Matching 用に最適化されたハイブリッドエンジンで置き換えます。

  • ゼロポイント修正: 0 + ノイズ = 純粋なノイズ を保証し、注入前に潜在空間をクリアします。

  • Wan シグマ計算機: Wan 2.1/2.2 に必要な特定のシフト式を使用します。

  • チェーンアーキテクチャ: マスターのシグマクロックをノード間で渡すことで「Hires Fix」を実現します。

2. ユニバーサルローダー(cyberdyne_model_hub.py

チェックポイント、SafeTensors、GGUF モデルを統合して読み込むローダーです。

  • 再帰的検索: サブディレクトリ内のモデルを自動的に検出します。

  • GGUF 委譲: GGUF ファイルを検出し、適切なバックエンドにルーティングします。

  • スマートオフロード: 未使用モデルを積極的に RAM にオフロードし、サンプラー用の VRAM を確保します。

3. ビジュアル優位性スイート(wan_visual_supremacy.py

「AI プラスチック感」を克服する「秘密のレシピ」です。

  • Latent Detailer X: 復号前にマイクロディテールを注入しつつ、シグナルの飽和を防止します。

  • Temporal Lock Pro: 復号後の安定化ツールで、低差分フレームをブレンドし、フラッカーを排除します。

  • OLED Dynamix(ARRI ロールオフ): ハイライトのテクスチャを保持する対数圧縮カーブです。

4. ナノリペアシステム(wan_genisys.py

  • ノード: Cyberdyne Genisys [OMNISCIENT]

  • 機能: TF32/BF16 における「ブラックスクリーン」問題を解決。テンソルのドリフトを計算し、NaN に到達する前に値をクランプします。

5. T-X インターポレーター(wan_tx_node.py

  • 機能: スタート画像とエンド画像の間で動画を生成します。

  • 革新: 単純なブレンドではなく、逆構造反発 を使用して、モデルが変換パスを幻覚させるように強制します。


🎛️ 推奨ワークフローストラテジー

究極の 8K OLED ルックを得るには、以下の順序でノードをチェーンしてください:

  1. ローダー: Cyberdyne Model Hub(モデルとVAEを読み込み)

  2. プロンプト: Wan Text Cache および Wan Vision Cache

  3. 生成: WanImageToVideoUltraXT-404 Skynet 1 (Master)

  4. 精緻化: XT-404 Skynet 3 (Refiner)(ノイズ除去 0.3)

  5. 復号: VAE Decode

  6. ビジュアル優位性スタック:

    • Temporal Lock Pro(ピクセルを安定化)

    • OLED Dynamix(光をスカルプト)

    • Organic Skin(テクスチャを追加)

  7. 最終仕上げ: Wan Chroma Mimic(シグナルを検証しシャープネスを調整)

  8. エンコード: Video CombineWan Compressor


📟 コンソール HUD(XT-Mouchard)

コンソールを無視しないでください!このスイートはシグナルの健康状態を伝達します:

  • 🟢 グリーン: シグナルは正常です。

  • 🟡 イエロー: 高シグナルが検出されました(ロールオフが有効)。

  • 🔴 レッド: 致命的な飽和/白飛び(specular_pop を下げてください)。

例:

[XT-MIMIC] 🎨 FINAL VALIDATION | DynRange: [0.000, 0.982]
   └── Signal Integrity: OK (Clip: 0.00%)

これは、数学的に完璧なブラックとホワイトを 98.2% で制限し、ディスプレイのブロームを許容することを意味します。


📜 クレジット

  • アーキテクト: XT-404 Omega

  • 企業: Cyberdyne Systems

  • ステータス: GOLD MASTER (V3.8)

"運命など存在しない。我々が作り出すものだけが真の運命だ。"


Cyberdyne Research Division が管理しています。「インフィルトレーションレポート」は issue でご連絡ください。


🤖 XT-404 Skynet : Wan 2.2 Sentinel Suite (OMEGA EDITION)

Cyberdyne Systems Corp. | Series T-800 | Model 101

Version Architecture Engine New Module

"未来は決まっていない。我々自身が作り出すものだけが真の運命だ。"


⚠️ クリティカルなシステム依存

注意

インフィルトレーションプロトコル(GGUF): Cyberdyne Model Hub で GGUF クアンタイズモデルを使用するには、ComfyUI-GGUF エンジンが必須です。

📥 エンジンのダウンロード: city96/ComfyUI-GGUF

このエンジンがなければ、Cyberdyne Model Hub は Safetensors のみモードで動作します。


🚀 なぜ XT-404 Skynet を選ぶのか?(競合分析)

標準ノードは汎用的な実装に依存します。XT-404 Skynet は、Wan 2.2 の特異性に特化してカスタム設計されたアーキテクチャです。

機能 標準ノード/競合 🤖 XT-404 Skynet アーキテクチャ
精度 標準 FP16/BF16(バンドリング発生) ハイブリッド FP32/TF32 コンテキストスイッチング(バンドリングゼロ)
インターポレーション 単純な線形フェード(静的/凍結) T-X デュアルフェーズラッパー(ネイティブVAE注入)
カラーサイエンス RGB クリッピング LAB スペース変換 & OLED Dynamics(シネマグレード)
キャッシング 基本的な TeaCache(モーションフリーズリスク) T-3000 Genisys(運動量 & ナノリペア搭載)
スケーリング ビリニア(ぼやけ) Lanczos/Bicubic FP32(ピクセルパーフェクト)
メモリ 高VRAM使用(OOMリスク) 外科的ピン留めメモリ(DMA) & 激しいプルージュ

🌍 ニューラルネットナビゲーション

🇺🇸 英語ドキュメント

  1. ビジュアルエンジニアリング(Wan Chroma Mimic)

  2. インフィルトレーション(モデルローダー)

  3. ニューラルネットコア(XT-404 サンプラー)

  4. T-3000 Genisys(オムニスカイントキャッシュ)

  5. ミメティックレンダリング(I2V Ultra & Fidelity)

  6. ポリメトリックアルロイ(T-X デュアルフェーズ) 🆕

  7. センサー&アクセラレーター(オメガツール)

  8. ポストプロセッシング&オートメーション

🇫🇷 フランス語ドキュメント

詳細な技術情報をご確認ください。


🇺🇸 英語ドキュメント

🎨 フェーズ0:ビジュアルエンジニアリング(Wan Chroma Mimic)

ファイル: wan_chroma_mimic.py

究極のカラーグレーディングエンジン。 単なるフィルターではありません。これはGPU上でリアルタイムで動作し、画像テンソルをLAB色空間に変換して、明るさと色情報を分離し、照明データを破壊せずにシネマグレードのリファレンスを可能にします。

🔥 主な機能と設定

  • アーキテクチャ: 100% PyTorch GPU。0% CPU遅延。

  • 形態学フィルター: 動画ディフュージョンで発生するマイクロアーティファクト(黒白ドット)を拡大する前に除去します。

  • OLED Dynamics: 0.5を中心に非線形のSカーブを適用し、ブラックを深めつつハイライトを保持します。

パラメータ 推奨値 説明
reference_image 必須 ソース画像(スタイルの参照)。ムードはここから抽出されます。
effect_intensity 0.25 LAB変換のブレンド強度。
oled_contrast 0.00 「Netflix」スタイル。 ダイナミックレンジを強化。0.0 = ニュートラル。
skin_metal_smooth 0.25 スマートサーフェスブラー。 皮膚・金属を滑らかにし、エッジを検出してシャープネスを保持。
detail_crispness 0.2 シネマ・ピケ。 差分ガウシアン法でマイクロディテールを強調。


🛡️ フェーズ1:浸透(Cyberdyneモデルハブ)

ファイル: cyberdyne_model_hub.py

SafetensorsとGGUFアーキテクチャを統合するローダー。Wan 2.2の「デュアルUNet」要件を自動的に解決します。

  • 再帰的スキャナー: サブフォルダ内にモデルを検出。
  • Skynetプロトコル: アクティブなVRAM管理。読み込み前にチェックサム(SHA256)を計算し、メモリ断片化を防ぐためにメモリを解放。
  • ハイブリッドローディング: 高解像度FP16モデルと低解像度GGUFモデルを同時に読み込み可能。

🧠 フェーズ2:ニューラルネットコア(XT-404サンプラー)

ファイル: XT404_Skynet_Nodes.py

「Sentinel」エンジン。標準サンプラーとは異なり、Wan 2.2に必要なsimple(線形)スケジューラーがハードコードされており、標準KSamplersで見られる「焼き付き出力」の問題を回避。

🔴 XT-404 Skynet 1(マスター)

  • シフト値(5.0): Wan 2.2の潜在タイムリングにおける重要な設定。
  • Bongmathエンジン: カスタムテクスチャノイズ注入システム。
    • True:アナログフィルムグレインの整合性を追加。
    • False:純粋なデジタルクリーンさ。

🟡 XT-404 Skynet 2(チェーン)

  • シードロック: options辞書を介してマスターノードのシードを自動的に継承。生成パス間で時間的一貫性を確保。

🟢 XT-404 Skynet 3(リファイナー)

  • リサンプルモード: チェーンの最後に制御されたノイズを注入し、高周波ディテールを空想的に生成。

💀 フェーズ3:T-3000 Genisys(全知キャッシュ)

ファイル: wan_genisys.py

TeaCacheより優れている。 標準のTeaCacheは差が低すぎると動画の動きをフリーズさせます。T-3000は「運動モメンタム」を使用。

  • 運動モメンタム: 動きが検出された場合、次のXフレームの計算を強制し、「マネキンチャレンジ」効果を回避。
  • ナノ修復: テンソルストリーム内のNaNまたはInf値(黒画面バグ)を検出し、ハードクリッピングではなくソフトクランプ(-10/+10)で外科的に修復。
  • HUD: コンソールにリアルタイムの信号整合性とドリフト指標を表示。

🎭 フェーズ4:模倣レンダリング(I2V Ultra & フィデリティ)

ファイル: nodes_wan_ultra.py / wan_fast.py

🌟 Wan Ultra(クオリティの王)

  • 核融合正規化: Bicubic-AntiAliasを使用して入力画像を厳密に0.0–1.0の範囲に整備。
  • ディテールブースト: VAEエンコード前にシャープニング畳み込み行列を適用し、圧縮ぼやけを補正。
  • モーションアンプ: 「ソフトリミッター」(Tanhカーブ)を使用して、物理法則を破ることなくモーションベクトルを増幅。

⚡ Wan Fidelity(スピードの王)

  • 最適化: メモリ効率を高めるため、連結ではなくtorch.fullを使用。
  • ロジック: 完全な時間的整合性を実現するため、元のWan 2.1のコンテキストウィンドウロジックを復元。

🧪 フェーズ6.5:ポリメトリック合金(T-Xデュアルフェーズ)[新規]

ファイル: wan_tx_node.py

補間特異点。 標準のI2Vモデルは特定の最終フレームに到達するのが困難(しばしばフリーズまたはスタイルを失う)。T-XエンジンネイティブVAE注入ラッパーを使用してタイムラインを完璧にブリッジ。

  • キーフレーム注入: 潜在空間を破損することなく、[開始フレーム → 空の虚無 → 終了フレーム]をエンコードするためにVAEの内部ロジックを一時的に上書き。
  • 流動的モーフィング: Wan 2.2モデルに点Aと点Bの間の物理方程式を解かせ、「スライドショー」効果を回避。
  • スマートVRAMスキャナー: GPU容量を自動検出し、「セーフ」(512pxタイリング)と「ウルトラ」(1280pxタイリング)モードを切り替え。

パラメータ 説明
start_image 開始フレーム(フレーム0)。
end_image 目標フレーム(フレームN)。T-Xエンジンはこの画像への収束を強制。
motion_amp キーフレーム間の潜在モーションベクトルを増幅。
detail_boost VAE圧縮中にテクスチャを保持するための前処理シャープニング。


⚡ フェーズ5:センサー & アクセラレーター(Omegaツール)

🚀 Wanハードウェアアクセラレーター(Anti-Burn V4)

ファイル: wan_accelerator.py パフォーマンスの「隠し味」。

  • 問題: Wan 2.2でTF32を有効にすると、正規化エラーにより画像が「焼け」(コントラスト問題)を起こす。
  • 解決策(コンテキストスイッチング): このノードは速度のためにTF32をグローバルに有効にしますが、GroupNormLayerNormレイヤーをインターセプトしてFP32精度に強制。
  • 結果: TF32の30%速度向上と、FP32のビジュアル品質を両立。

👁️ Wanビジョン&テキストキャッシュ(DMA)

ファイル: wan_i2v_tools.py

  • ピン止めメモリ: テキスト埋め込みをCPUページロックメモリ(DMA)でGPUに即座に転送。
  • ビジョンハッシュ: 画像コンテンツ(ストライドを含む)をハッシュ化し、同じCLIPビジョン入力を再エンコードしないように。

🛠️ フェーズ6:ポストプロセッシング & 自動化

  • Wanコンプレッサー(Omega): スレッドセーフなH.265エンコード。CPUスレッドを16に制限し、Threadripper/i9のクラッシュを回避。
  • Wanサイクルターミネーター: Windows APIのEmptyWorkingSetを使用してRAMスタンバイリストをフラッシュ(OSの立ち往生を防止)。
  • Auto Wanオプティマイザー: スマートリサイズ。Wanに必要なModulo 16の寸法を強制し、OOM(>1024px)を回避。

このモデルで生成された画像

画像が見つかりません。