Qwen Image Edit 2511 Ultimate

详情

下载文件

模型描述

Qwen 图像编辑 2511 — 双图像编辑工作流(基础图 + 参考图)

此工作流使用 Qwen 图像编辑 2511 进行双图像引导编辑:您提供一张基础图像(需要编辑的图像)和一张参考图像(用于指导风格、服装、身份特征、构图或您希望实现的具体修改)。模型将您的提示与参考图像的引导相结合,在保留基础图像结构的同时,实现可控的编辑。

已测试环境

GPU:Nvidia RTX 4060 Ti 16GB
内存:64GB DDR5
生成时间:90-150 秒(4-6 步)

此工作流适用场景

  • 使用参考图像进行服装/风格替换
  • 由参考图像引导的背景替换
  • 面部/细节增强(配合去模糊 LoRA)
  • 产品/样机编辑,保持一致的光影与风格
  • “让我的图像看起来像这样”的编辑,无需从零重新生成

输入(2张图像)

  1. 基础图像(必需)
    您希望修改的原始图像。

  2. 参考图像(必需)
    引导图像:包含风格、服装、姿态提示、构图、材质细节或“目标效果”。

工作原理(概览)

  • 工作流加载以下组件:

    • Qwen 图像编辑 2511 扩散模型
    • Qwen 2.5 VL 文本编码器
    • CLIP Vision 用于图像理解
    • Qwen 图像 VAE
  • 两张图像均被编码并用作条件输入:

    • 基础图像锚定结构与布局。
    • 参考图像驱动所需的修改(风格/外观/细节)。
  • 提示控制保留哪些内容与更改哪些内容:

    • 使用 “保留” 语言保留基础图像的细节。
    • 使用 “从参考图像中应用” 语言提取参考图像的细节。

提示技巧(效果极佳)

结构:

  • 保留 / 保持:必须从基础图像中保留的内容
  • 从参考图像中应用:需要转移的内容
  • 约束:真实感、光影、材质,避免额外改动

示例提示:

编辑基础图像。保留基础图像中的面部特征、皮肤纹理和身体比例。从参考图像中应用发型、服装设计和配饰。保持与基础图像相同的拍摄角度和姿态。使用写实材质、干净光影、高细节,不添加额外配饰。

负面提示示例:

模糊、低质量、多余手指、扭曲面部、变形、错误的服装细节、不一致的光影、文字、水印、Logo

推荐初始设置

  • 步数:4
  • CFG:1
  • 去噪强度:1

LoRA 使用(可选但推荐)

  • Lightning 4-Steps LoRA
    适用于快速编辑,并在低步数下获得稳定结果。

  • 去模糊 LoRA
    当细节显得柔和(尤其是面部/纹理)时使用。
    保持 LoRA 强度适中,避免过度锐化伪影。

最佳实践

  • 使用干净、高分辨率的参考图像,确保服装/细节清晰。
  • 如果模型过度修改了基础图像:降低去噪强度
  • 如果模型忽略了参考图像:略微提高去噪强度,并明确强调“从参考图像中应用”。
  • 为获得一致结果,在提示中保持光影约束(例如:“与基础图像相同的光影”)。

输出

生成一张编辑后的图像,在保留基础构图的同时,根据参考图像和提示应用相应修改。

此模型生成的图像

未找到图像。