Qwen Image Edit - Fast & Simple Outpainting

詳細

ファイルをダウンロード

モデル説明

ワークフローの概要

これは、Qwen Image Edit モデルを使用した高品質な画像のアウトペイント向けに設計された効率的で強力なComfyUIワークフローです。アウトペイントとは、元の画像の境界を超えて拡張し、元のスタイル、明るさ、コンテキストと自然に融合する新しいコンテンツを生成する手法です。このワークフローは、スピードと簡便さを最適化しており、わずか数ステップで驚異的な結果を実現します。

核心概念:画像をアップロードすると、AIがキャンバスを自動的に拡張し、シーンの自然で整合性のある拡張部分を生成し、元の画像と完全に融け合います。


主な特徴とハイライト

  • 🤖 専用モデル:アウトペイントやインペイントなどの画像編集タスクに特化して微調整された Qwen_Image_Edit-Q5_0.gguf モデルを使用しています。

  • ⚡ 超高速処理Qwen-Image-Edit-Lightning LoRAを統合し、たった8ステップのサンプリングで高品質なアウトペイント結果を実現します。

  • 🎯 精密なプロンプト制御:画像のコンテキストを理解する専用の TextEncodeQwenImageEdit ノードを使用し、スムーズな拡張を確実に実行します。

  • 🖼️ 自動前処理:ワークフローは、アウトペイント用に画像にパディングを追加し、モデルに最適なサイズに自動スケーリングします。

  • 🔧 最適化されたパイプライン:アウトペイント用に専門家が設定したネガティブプロンプトと最適な設定(CFG、サンプラー)が事前構成されており、デフォルトで優れた結果が得られます。

  • 📁 1クリック操作:画像を読み込むだけでワークフローを実行できます。複雑な設定は一切不要です。


ワークフロー構成

ワークフローは、理解とカスタマイズが簡単なように論理的なセクションに整理されています:

  1. Step1 - モデルの読み込み:メインのQwen Image Editモデル、専用のCLIPビジョンエンコーダ、VAEを読み込みます。

  2. Step 2 - 編集用画像のアップロード:入力画像を読み込み、アウトペイント用にパディングとスケーリングの前処理を行います。

  3. Step 3 - プロンプト:AIに画像の拡張方法を指示する場所です。最適な結果を得るために、事前に用意されたポジティブプロンプトとネガティブプロンプトが使用されます。

  4. サンプリング&デコード:KSamplerがEulerサンプラーで8ステップ実行され、VAEが潜在空間のデータを最終的なアウトペイント画像にデコードします。

  5. 画像出力SaveImage ノードが最終結果を保存します。


このワークフローの使い方

  1. ダウンロードとインストール:

    • 欠落しているカスタムノードを簡単にインストールするために、ComfyUI Manager をインストールしてください。

    • 必要なカスタムノード:ComfyUI-GGUF(.ggufモデルの読み込み用)。

    • この投稿から .json ファイルをダウンロードしてください。

  2. モデルの読み込み:

    • メインモデルQwen_Image_Edit-Q5_0.ggufComfyUI/models/gguf/ フォルダに配置してください。

    • CLIPモデルqwen2.5-vl-7b-it-q4_0.gguf を同じ gguf/ フォルダに配置してください。

    • VAE:ワークフローは qwen_image_vae.safetensors を参照しています。これを models/vae/ フォルダに配置してください。

    • LoRAQwen-Image-Edit-Lightning-8steps-V1.0-bf16.safetensorsmodels/loras/ フォルダに配置してください。LoRA読み込みノードのパスを調整してください(例:qwen_loras/ のようなサブフォルダに配置した場合)。

  3. 画像の読み込み:

    • LoadImage ノードで、画像名をご自身のファイル名(例:my_landscape.jpg)に変更してください。
  4. アウトペイントのカスタマイズ(オプション):

    • ポジティブプロンプトは一般的なアウトペイント用に事前設定されています。具体的な要望(例:「庭を拡張して噴水を追加」)がある場合は、ポジティブプロンプトノード(TextEncodeQwenImageEdit)内のテキストを編集してください。
  5. ワークフローの実行:

    • ComfyUIでプロンプトをキューに追加してください。最終画像は ComfyUI/output/ フォルダに保存されます。

技術的詳細と使用ノード

ノード 目的 主な設定
LoaderGGUF メインのQwen Image Editモデルを読み込む Qwen_Image_Edit-Q5_0.gguf
ClipLoaderGGUF Qwenビジョンエンコーダを読み込む qwen2.5-vl-7b-it-q4_0.gguf
VAELoader 符号化/復号化用のQwen VAEを読み込む qwen_image_vae.safetensors
LoraLoaderModelOnly 高速サンプリング用のLightning LoRAを適用 Strength: 1.0
LoadImage 入力画像を読み込む
ImagePadForOutpaint 核心ノード。AIが埋めるための画像周囲に透明パディングを追加 Left/Right: 384, Top/Bottom: 0, Feather: 48
ImageScaleToTotalPixels パディング済み画像をモデルの最適サイズにスケーリング Megapixels: 0.9
TextEncodeQwenImageEdit ポジティブプロンプト:モデルに拡張方法を指示
TextEncodeQwenImageEdit ネガティブプロンプト:モデルにシームやアーチファクトの回避を指示
VAEEncode スケーリング済み画像を潜在空間に符号化
ModelSamplingAuraFlow Aura Flowサンプリング用にモデルを設定 Shift: 3.0
CFGNorm CFG用にモデルをパッチ適用 Strength: 1.0
KSampler アウトペイントのノイズ除去プロセスを実行 Steps: 8, Sampler: euler, CFG: 1.0, Denoise: 0.95
VAEDecode 最終的な潜在変数を画像に復号化
SaveImage 完成したアウトペイント画像を保存

最良の結果を得るためのヒント

  • 画像の選択:明確で継続可能な背景(例:空、水、壁、フィールド)を持つ画像から始めましょう。AIが継続しやすい明確なパターンがあるほど、結果は自然になります。

  • プロンプトの誘導:提供されたポジティブプロンプトは一般的な使用に最適です。より創造的な制御をしたい場合は、次のような指示を試してください:「右側に小道を追加して森を拡張」または「同じゴシック様式で建築物を継続」。

  • パディング設定ImagePadForOutpaint ノードは左右に各 384 ピクセルのパディングを追加するよう設定されています。この値(例:512256)を調整して、各方向への拡張量を制御できます。

  • ノイズ除去強度0.95 のノイズ除去値は、元画像をほぼそのまま維持します。低い値(例:0.8)はより保守的になり、創造性が犠牲になる可能性があります。高い値はAIに自由度を与える一方で、元画像を変形させるリスクがあります。


必要なモデル(ダウンロードリンク)

  1. Qwen_Image_Edit-Q5_0.gguf: https://huggingface.co/QuantStack/Qwen-Image-Edit-GGUF

  2. qwen2.5-vl-7b-it-q4_0.gguf: https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/text_encoders

  3. qwen_image_vae.safetensors: https://huggingface.co/QuantStack/Qwen-Image-Edit-GGUF

  4. Qwen-Image-Edit-Lightning-8steps-V1.0-bf16.safetensors: https://huggingface.co/lightx2v/Qwen-Image-Lightning/tree/main


まとめ

このワークフローは、Qwen Image Editモデルがアウトペイントタスクに持つ驚異的な能力を示しています。技術的なハードルを下げ、一連のシンプルな1クリック操作で、画像を創造的に拡張しつつ完全な一貫性を維持できる解決策を提供します。写真家、デジタルアーティスト、創造的なキャンバスを広げたいすべての人にとって、ぜひ試してほしいワークフローです。

このワークフローをご使用の際は、ぜひご自身の成果を共有してください!どんな作品が生まれるか、楽しみにしています。

このモデルで生成された画像

画像が見つかりません。