Wan 2.2 simple Text to Image GGUF (txt2img) workflow
詳細
ファイルをダウンロード
モデル説明
どうも、gguffersたち。はい、今回は画像生成に動画モデルを使用します。改めて言いますが、これはテキストから画像へのワークフローです。なぜかというと、突然WANが非常にクールな写実的な画像を生成できるようになったからです。また、このワークフローは他のものとは異なり、非常にシンプルで最小限のプラグイン(修正済みノード)しか使用しません。それでは、これらの変なGGUFたちを手に入れて、動かしていきましょう。
必要条件:
- ComfyUI v0.3.49+
- ComfyUI Manager v3.35+
- 16GBのVRAM(または、より低品質の量子化を選択すれば12GB)と32GBのRAM
インストール:
モデルファイルをダウンロード:
メインモデル - Wan2.2-T2V-A14B-LowNoise-Q6_K(ComfyUI\models\unet に配置)。オプション:16GB VRAMならQ6_K、12GBならQ5_K_Sを選択。Q8なら24GBに収まります。
テキストエンコーダーモデル - umt5-xxl-encoder-Q6_K(ComfyUI\models\text_encoders に配置)。オプション:Q6_Kまたは同様のものを選択。
VAE - Wan2.1_VAE(ComfyUI\models\vae に配置)。
LoRA - Wan2.2-Lightning_T2V-v1.1-A14B-4steps-lora_LOW_fp16(ComfyUI\models\lora に配置)。注意:正しいモデルをダウンロードしてください。低ノイズと高ノイズ、T2VとI2Vを混同しないでください。以上。
このワークフローをダウンロードしてComfyUIで開いてください。
「Manager」→「Custom Nodes Manager」に移動し、「ComfyUI-GGUF」v1.1.3以上をインストールしてください(古いバージョンでは「Unexpected text model architecture type」というエラーが発生する可能性があります)。ComfyUIを再起動してください。
使用方法:
解像度を選択:720p または 1080p(1088)が適しています。
ステップ数とサンプラーを選択:
- 10〜12ステップで 1.0〜1.3 のCFGが推奨されます。より高いコントラストと幻覚の除去を目的として、ステップを20まで増やすこともできます。サンプラー:euler, euler_cfg_pp, dpmpp_2m, dpmpp_sde, dpmpp_2m_sde, dpmpp_2s_a;スケジューラ:karras または exponential。
- LoRAを無効にする場合、20〜30ステップ以上、CFGを約3.5に設定。サンプラー:euler simple、karras など。
クラッシュや接続切断が発生した場合は、より低品質の量子化(low quants)を使用してください。
GGUFノードのインストール中に他のエラーが発生した場合は、ComfyUIとManagerをクリーンインストールして再試行してください。
この動作確認は、ComfyUI Windowsポータブル版 v0.3.49、32GB RAM、16GB VRAM搭載の5060Tiで実施しました。



















