Qwen Image Edit Comfyui Workflow

詳細

ファイルをダウンロード

モデル説明

Qwen Image Edit ComfyUI ワークフロー:基本的な説明

このワークフローは、Qwenモデルを使用してComfyUIで画像編集を行う方法を示しており、テキストプロンプトによるスタイル変換と条件付けに焦点を当てています。以下に、このプロセスの構造化された概要を示します:

1. ローダーセクション

  • Diffusionモデルの読み込み: 利用可能なオプションからQwen画像編集用Diffusionモデルを選択して読み込みます。このモデルは、提供された指示に基づいて画像を生成・編集する役割を担います。

  • CLIPの読み込み: 画像-テキスト条件付けに必要なCLIPモデルを読み込みます。これにより、テキストプロンプトが画像内の特定の視覚的特徴と結びつけられます。

  • VAEの読み込み: 潜在画像表現を視覚的に表示可能な画像に復元するため、変分自己符号化器(VAE)モデルを読み込みます。

2. 条件付けセクション

  • テキスト条件付け: TextEncodeQwenImageEditノードを使用してプロンプトを入力します(例:「アニメ風に変更」)。これにより、ワークフローは提供されたテキスト記述に従って画像を変更できます。

  • 画像参照: 編集対象となる元の画像を読み込みます。必要に応じて、対象編集用のマスクを提供できます。

3. 前処理

  • メガピクセルへのスケーリング: 参照画像を目的のメガピクセルサイズにスケーリングし、出力解像度が要件に一致するようにします。

4. サンプラー セクション

  • 潜在サイズ選択: 出力サイズ(解像度)および強度やシードなどのその他のサンプリングパラメータを定義します。これらはランダム性と一貫性に影響を与えます。

  • スケジューラーとサンプラーの選択: スケジューラーとサンプラーを設定します。一般的な設定は以下の通りです:

    • スケジューラー:ステップ数とノイズ除去の強度を制御します。

    • サンプラー:サンプリングプロセスに適したアルゴリズム(例:Euler)を選択します。

5. 生成ノード

  • ランダムノイズ: 選択したシードに一致するランダムノイズでプロセスを初期化します。

  • CFGガイド: CLIP条件付けとプロンプトに基づいて、ターゲット画像へのプロセスを誘導します。

6. 復号化と出力

  • サンプラーとデコーダー: 生成された潜在画像はVAEによって復号化され、最終的な視覚的出力に変換されます。

  • 保存/エクスポート: 得られた画像を保存し、後続の使用や共有に備えます。


このワークフローは、テキストプロンプトで条件付けられたDiffusionモデルを活用し、直感的なノードベースのインターフェースで柔軟な画像編集を可能にします。モジュラー構造により、各ステップでカスタマイズが可能で、幅広い創造的・技術的アプリケーションに対応できます。

このモデルで生成された画像

画像が見つかりません。