Qwen Image Edit 2511 Ultimate

Qwen Image Edit 2511 — 2画像編集ワークフロー（ベース + リファレンス）

このワークフローは、Qwen Image Edit 2511を使用して2画像ガイド編集を実行します。編集したいベース画像と、スタイル、衣装、識別情報、構図、または具体的な編集内容を示すリファレンス画像を提供します。モデルは、プロンプトとリファレンスのガイドを統合して、ベース画像の構造を維持しつつ制御された編集を生成します。

テスト環境

GPU: Nvidia RTX 4060 Ti 16GB
RAM: 64GB DDR5
生成時間: 90–150秒（4–6ステップ）

このワークフローの用途

リファレンス画像を用いた衣装／スタイルの交換
リファレンスに従った背景の置き換え
顔／詳細の強化（デブラーLoRA使用）
一貫した照明・スタイルでの製品／モックアップ編集
完全に再生成することなく、「この画像のように見せたい」という編集

入力（2枚の画像）

ベース画像（必須）
　編集したい元の画像。
リファレンス画像（必須）
　ガイドとなる画像：スタイル、衣装、ポーズの手がかり、構図、素材の詳細、または「目標の見た目」。

動作の概要

ワークフローは以下の要素を読み込みます：
- Qwen Image Edit 2511 ディフュージョンモデル
- Qwen 2.5 VL テキストエンコーダー
- CLIP Vision（画像理解用）
- Qwen Image VAE
両画像はエンコードされ、条件として使用されます：
- ベース画像は構造とレイアウトの基準となります。
- リファレンス画像は要求される変更（スタイル・外観・詳細）を導きます。
プロンプトは、保持する要素と変更する要素を制御します：
- ベースの詳細を保持するには、「preserve（維持）」という表現を使用します。
- リファレンスから詳細を引き出すには、「apply from reference（リファレンスから適用）」という表現を使用します。

プロンプティングのコツ（非常に効果的）

構造：

保持／維持： ベース画像から必ず残す要素
リファレンスから適用： 移譲する要素
制約： 実写性、照明、素材、追加変更なし

例：

ベース画像を編集してください。ベース画像の顔のアイデンティティ、肌の質感、体の比率を維持してください。リファレンス画像のヘアスタイル、衣装デザイン、アクセサリーを適用してください。カメラアングルとポーズはベース画像と同じに保ってください。写実的な素材、クリーンな照明、高精細、追加のアクセサリーはなし。

ネガティブプロンプトの例：

ぼやけ、低品質、余分な指、歪んだ顔、変形、間違った衣装の詳細、不一致な照明、テキスト、ウォーターマーク、ロゴ

推奨初期設定

ステップ数： 4
CFG： 1
ノイズ除去／強度： 1

LoRAの使用（オプションですが推奨）

Lightning 4-Steps LoRA
　高速編集と低ステップでの安定した結果に最適。
Deblur LoRA
　詳細（特に顔やテクスチャ）が柔らかい場合に使用。
　過度なシャープネスアーチファクトを避けるため、LoRAの強度は控えめに。

最良の実践方法

衣装／詳細が明確な高解像度でクリーンなリファレンス画像を使用してください。
モデルがベース画像の多くを変更しすぎる場合：ノイズ除去を減らす。
モデルがリファレンスを無視する場合：ノイズ除去を少し増やし、「apply from reference」の表現を明確化する。
一貫した結果を得るには、プロンプトに照明の制約を含めてください（例：「ベースと同じ照明」）。

出力

ベースの構成を維持しつつ、リファレンス画像とプロンプトのガイドに従って編集された画像を生成します。

モデルタイプ	ワークフロー
ベースモデル	Qwen
公開日	1/12/2026