The One-Image Workflow: A Forge-Style Static Design for Wan Image, Z-Image, Qwen-Image, Flux2 & Others

詳細

ファイルをダウンロード

モデル説明

ワンイメージワークフローの紹介:Wan 2.1/2.2、Z-Image、Qwen-Image、Flux2 など向けのForge風静的デザイン

作者: Iory98

テスト環境: Windows 11、ComfyUI バージョン: v0.4.0 | フロントエンド バージョン: v1.33.13

ワークフロー内に完全なガイドが含まれています

導入と動機:もう「スパゲッティの山」は不要!

ComfyUIはAI生成に強力なプラットフォームですが、グラフベースの性質は初心者にとって intimidating に感じられることがあります。Forge WebUI や A1111 から移行してきた方にとって、「スパゲッティの山」と呼ばれるワークフローの管理は面倒に思えるでしょう。私は、プラットフォームは画像を生成することに集中できるべきだと信じています。

そこで、ワンイメージワークフローを考案しました。私の目標は、ユーザーインターフェースのように動作するワークフローを構築することです。最新のComfyUIサブグラフ機能を活用し、混沌とした構成を整理し、洗練された静的ワークスペースに整えました。

なぜ「ワンイメージ」なのか?

このワークフローは、量より質を重視して設計されています。50枚の画像を無差別に生成するのではなく、完璧な1枚の画像を構築するための構造化された3段階パイプラインを提供します:構成を生成し、モデルベースのハイレゾフィックスで詳細を精錬し、モジュラーなタイリングで4Kまでアップスケールします。

Wan 2.1 および Wan 2.2(テキスト→画像)に最適化されていますが、Qwen-Image、Z-Image、および単一のテキストエンコーダーを必要とするあらゆるモデルに対応可能です。

核心哲学:3段階パイプライン

このワークフローは単なる画像生成ではなく、画像を完璧に仕上げるためのものです。時間とVRAMを節約するためにモジュール式のロジックを採用しています:

· ステージ1 - 構成(低解像度):低解像度(例:1088x1088)で複数の画像を一括生成します。これは高速で、最適な構成を選び出すのに役立ちます。

· ステージ2 - ハイレゾフィックス:お気に入りの画像をハイレゾフィックスモジュールに通し、ディテールを追加してテクスチャを精錬します。

· ステージ3 - モジュラーなアップスケール:最終的にUltimate SD Upscaleモジュールを使用して、2Kまたは4Kの解像度までアップスケールします。

これらのステージを分離することで、4K生成に数分待った後に手が変だったと気づくという無駄を防ぎます。

「重ねられた」インターフェース:ナビゲーション方法

このワークフローの最もユニークな機能は「重ねられたプレビュー・システム」です。画面スペースを節約するため、3つの異なる画像比較ノードを重ねて配置しました。移動する必要はなく、上部のノードを折りたたむだけでその下のノードが表示されます。

· レイヤー1(上部):現在の画像 vs 前回の画像 — 最新の生成結果とその前の結果を比較します。
操作:ノードヘッダーの最小化アイコンをクリックしてこのレイヤーを隠し、レイヤー2を表示します。

· レイヤー2(中段):ハイレゾフィックス vs 元画像 — ステージ2の精錬結果とベース画像を比較します。
操作:このレイヤーを最小化してレイヤー3を表示します。

· レイヤー3(下段):アップスケール済み vs 元画像 — 最終的な超高解像度出力と入力画像を比較します。

コントロールパネル(サブグラフ)

このワークフローは7つの色分けされたサブグラフに分割されています。これらをWebブラウザの「タブ」と考えてください。設定を変更するときは展開し、ワークスペースを整理するときは折りたたんでください。

1. Wan_Main_Settings(ダッシュボード)

· 状態:常に展開

· 機能:これがホーム画面です。90%の時間を変更するパラメータがここに集約されています:

o プロンプト:ポジティブテキスト入力

o 生成データ:シード、サンプラー、スケジューラ、CFG、ステップ数

o 画像サイズ:ベース解像度をここで設定

o トグルスイッチ:リファイナー、ハイレゾフィックス、またはアップスケールステージをワイヤーを切断せずに簡単に有効/無効化

2. Wan_Model_Loaders(変更はここから)

· 機能:チェックポイントの読み込みを担当

· デュアルステージ読み込み:構造用に「メインモデル(高ノイズ)」と、ディテール用に「リファイナーモデル(低ノイズ)」を同時に読み込めます

· フォーマットの自由:GGUFとSafetensorsを混在させられます。メインにGGUF、リファイナーにSafetensorsを読み込んで、量子化の差をテストすることも可能

3. Wan_Model_Parameters(高度な調整)

· 機能:モデルの技術的設定

· 機能

o モデルフォーマット選択:GGUF vs Safetensorsのモデルタイプを選択

o MagCache最適化:VRAM使用量と速度を管理する設定

o デフォルトLoRAスタック:「常時有効」LoRA(例:LightningやTurbo LoRA)用の3つのスロットを束ねたもの

4. Wan_Unified_LoRA_Stack

· 機能:中央集権型LoRAローダー

· ロジック:メインモデルとリファイナーモデルに別々にLoRAを管理するのではなく、このスタックはスタイルLoRAを両方に適用します。最大6つのLoRAをサポートします。もちろん、上記のデフォルト(内部)LoRAと併用可能です。

· 注意:特定のモデルにのみ適用したいLoRAがある場合は、ワークフローに含まれる外部Power LoRAローダーを使用してください。

5. Wan_NAG_Settings(ネガティブプロンプト)

· 機能:画像に含めたくない要素を管理

· 機能:NAG(正規化アテンションガイド)設定を含み、標準的な方法よりもネガティブプロンプトへの準拠が向上することが多いです。また、画像ファイル名のプレフィックスと保存パスも管理

6. Wan_HiResFix_Settings(ステージ2)

· 機能:ステージ1で生成された画像を精錬

· 推奨:選んだ「ドラフト」画像を拡大するために使用します。リノイジング技術を用いて、低解像度版には存在しなかったディテールを追加

7. Wan_Upscaler_Settings(ステージ3)

機能:最終仕上げ。モデルの解像度限界を超えてアップスケール

モジュール:Ultimate SD Upscaleを使用

ロジック:タイルアップスケールを可能にし、VRAMを消費せずに4K解像度まで到達できます。元画像またはハイレゾフィックス済み画像のどちらでもこのモジュールにフィードできます。

要件とインストール

このワークフローを使用するには、ComfyUI Managerがインストールされている必要があります。ワークフローを読み込むと、「Missing Custom Nodesをインストール」をクリックしてください。

主なカスタムノード:

· rgthree-comfy:ミュートスイッチと画像比較ノード用

· ComfyUI Impact Pack:高度なワークフローロジック用

· ComfyUI-Easy-Use:パラメータ処理の簡素化用

· ComfyUI-KJNodes:UI強化用

· UltimateSDUpscale:ステージ3のアップスケール用

· ComfyUI-GGUF:GGUF量子化モデルを使用する場合に必須

· Was Node Suite:さまざまなI/Oタスク用

クイックスタートガイド

  1. モデルを読み込む:Model_Loadersサブグラフを開き、Wan 2.1(またはその他の)チェックポイントを選択

  2. 解像度を設定:Main_Settingsで高速プレビュー解像度を設定(例:832x1216または1024x1024)

  3. プロンプトを入力:Main_Settingsまたは接続されたポジティブプロンプトフィールドにテキストを入力

  4. 生成:Queue Promptを押す

  5. 確認:上部の「現在 vs 前回」プレビューを確認

  6. 精錬(任意):シードが気に入ったら、Main_Settingsで「Enable Hi-Res Fix」をオンにし、再度生成してディテールを磨き上げる。上部プレビューを折りたたんで結果を確認

このモデルで生成された画像

画像が見つかりません。