Wan 2.2 simple Text to Image GGUF (txt2img) workflow

詳細

ファイルをダウンロード

モデル説明

どうも、gguffersたち。はい、今回は画像生成に動画モデルを使用します。改めて言いますが、これはテキストから画像へのワークフローです。なぜかというと、突然WANが非常にクールな写実的な画像を生成できるようになったからです。また、このワークフローは他のものとは異なり、非常にシンプルで最小限のプラグイン(修正済みノード)しか使用しません。それでは、これらの変なGGUFたちを手に入れて、動かしていきましょう。

必要条件:

インストール:

  • モデルファイルをダウンロード:

    • メインモデル - Wan2.2-T2V-A14B-LowNoise-Q6_K(ComfyUI\models\unet に配置)。オプション:16GB VRAMならQ6_K、12GBならQ5_K_Sを選択。Q8なら24GBに収まります。

    • テキストエンコーダーモデル - umt5-xxl-encoder-Q6_K(ComfyUI\models\text_encoders に配置)。オプション:Q6_Kまたは同様のものを選択。

    • VAE - Wan2.1_VAE(ComfyUI\models\vae に配置)。

    • LoRA - Wan2.2-Lightning_T2V-v1.1-A14B-4steps-lora_LOW_fp16(ComfyUI\models\lora に配置)。注意:正しいモデルをダウンロードしてください。低ノイズと高ノイズ、T2VとI2Vを混同しないでください。以上。

    • このワークフローをダウンロードしてComfyUIで開いてください。

    • 「Manager」→「Custom Nodes Manager」に移動し、「ComfyUI-GGUF」v1.1.3以上をインストールしてください(古いバージョンでは「Unexpected text model architecture type」というエラーが発生する可能性があります)。ComfyUIを再起動してください。

使用方法:

  • 解像度を選択:720p または 1080p(1088)が適しています。

  • ステップ数とサンプラーを選択:

    • 10〜12ステップで 1.0〜1.3 のCFGが推奨されます。より高いコントラストと幻覚の除去を目的として、ステップを20まで増やすこともできます。サンプラー:euler, euler_cfg_pp, dpmpp_2m, dpmpp_sde, dpmpp_2m_sde, dpmpp_2s_a;スケジューラ:karras または exponential。
    • LoRAを無効にする場合、20〜30ステップ以上、CFGを約3.5に設定。サンプラー:euler simple、karras など。

クラッシュや接続切断が発生した場合は、より低品質の量子化(low quants)を使用してください。

GGUFノードのインストール中に他のエラーが発生した場合は、ComfyUIとManagerをクリーンインストールして再試行してください。

この動作確認は、ComfyUI Windowsポータブル版 v0.3.49、32GB RAM、16GB VRAM搭載の5060Tiで実施しました。

このモデルで生成された画像

画像が見つかりません。