Qwen Image Edit - Fast & Simple Outpainting

详情

下载文件

模型描述

工作流程概览

这是一个高效且强大的 ComfyUI 工作流程,专为使用 Qwen Image Edit 模型 进行高质量 图像外延(outpainting) 而设计。图像外延允许您将图像扩展至其原始边界之外,无缝生成与原图风格、光照和上下文相匹配的新内容。此工作流程经过优化,实现快速与简洁操作,仅需几步即可获得令人印象深刻的效果。

核心理念:上传一张图像,AI 将智能扩展画布,在完美融合新内容与原图的同时,生成合理且连贯的场景延伸。


关键功能与亮点

  • 🤖 专用模型:使用 Qwen_Image_Edit-Q5_0.gguf 模型,该模型经过专门微调,适用于图像编辑任务,如外延和内补(inpainting)。

  • ⚡ 极速处理:集成 Qwen-Image-Edit-Lightning LoRA,仅需 8 步采样 即可生成高质量的外延结果。

  • 🎯 精准提示:使用专用的 TextEncodeQwenImageEdit 节点,能够理解图像上下文,确保模型准确执行无缝扩展指令。

  • 🖼️ 自动预处理:工作流程会自动为您的图像添加填充以创建外延空间,并缩放至模型的最优尺寸。

  • 🔧 优化流程:已预配置专家级负向提示与最优设置(CFG、采样器),默认即可获得出色效果。

  • 📁 一键操作:只需加载您的图像并运行工作流程,无需调整复杂设置。


工作流程结构

工作流程被清晰划分为逻辑模块,便于理解与自定义:

  1. 步骤1 - 加载模型:加载主 Qwen Image Edit 模型、专用 CLIP 视觉编码器和 VAE。

  2. 步骤2 - 上传待编辑图像:加载您的输入图像并进行外延预处理(填充与缩放)。

  3. 步骤3 - 提示:在此处向 AI 提供外延指令,已预设正向与负向提示以获得最佳效果。

  4. 采样与解码:使用 Euler 采样器运行 KSampler,共 8 步,VAE 将潜在空间数据解码为最终外延图像。

  5. 图像输出SaveImage 节点保存最终结果。


如何使用此工作流程

  1. 下载与安装

    • 确保已安装 ComfyUI Manager,以便轻松安装缺失的自定义节点。

    • 所需自定义节点:ComfyUI-GGUF(用于加载 .gguf 模型)。

    • 从本帖下载 .json 文件。

  2. 加载模型

    • 主模型:将 Qwen_Image_Edit-Q5_0.gguf 放入 ComfyUI/models/gguf/ 文件夹。

    • CLIP 模型:将 qwen2.5-vl-7b-it-q4_0.gguf 放入同一 gguf/ 文件夹。

    • VAE:工作流程指向 qwen_image_vae.safetensors,请确保其位于 models/vae/ 文件夹中。

    • LoRA:将 Qwen-Image-Edit-Lightning-8steps-V1.0-bf16.safetensors 放入 models/loras/ 文件夹。若您的 LoRA 存放在子文件夹(如 qwen_loras/),请在 LoraLoader 节点中调整路径。

  3. 加载您的图像

    • LoadImage 节点中,将图像名称改为您的文件名(例如:my_landscape.jpg)。
  4. 自定义外延(可选)

    • 正向提示已为通用外延预设。如需特定指令(例如:“扩展花园并添加喷泉”),可修改 正向提示 节点(TextEncodeQwenImageEdit)中的文本。
  5. 运行工作流程

    • 在 ComfyUI 中排队提示,最终图像将保存至 ComfyUI/output/ 文件夹。

技术细节与使用节点

节点 用途 关键设置
LoaderGGUF 加载主 Qwen Image Edit 模型 Qwen_Image_Edit-Q5_0.gguf
ClipLoaderGGUF 加载 Qwen 视觉编码器 qwen2.5-vl-7b-it-q4_0.gguf
VAELoader 加载 Qwen VAE 用于编码/解码 qwen_image_vae.safetensors
LoraLoader ModelOnly 应用 Lightning LoRA 以加速采样 强度:1.0
LoadImage 加载输入图像
ImagePadForOutpaint 核心节点:为 AI 填充区域添加透明边框 左/右:384,上/下:0,羽化:48
ImageScaleToTotalPixels 将填充后的图像缩放至模型最优尺寸 兆像素:0.9
TextEncodeQwenImageEdit 正向提示:指导模型如何扩展图像
TextEncodeQwenImageEdit 负向提示:指导模型避免接缝、伪影
VAEEncode 将缩放后的图像编码至潜在空间
ModelSamplingAuraFlow 配置模型为 Aura Flow 采样 Shift:3.0
CFGNorm 为 CFG 打补丁 强度:1.0
KSampler 执行外延去噪过程 步数:8,采样器:euler,CFG:1.0,去噪强度:0.95
VAEDecode 将最终潜在数据解码为图像
SaveImage 保存已完成的外延图像

最佳效果提示

  • 图像选择:建议从具有清晰、可延续背景的图像开始(例如:天空、水面、墙壁、田野)。当 AI 能够延续明显模式时,效果最自然。

  • 提示引导:提供的正向提示适用于通用场景。如需更多创意控制,可尝试指令如:“在右侧延伸森林并添加小径”,或“以相同的哥特式风格延续建筑”。

  • 填充设置ImagePadForOutpaint 节点默认在左右两侧各添加 384 像素。您可调整这些值(例如:512256)来控制各方向的扩展幅度。

  • 去噪强度0.95 的去噪值意味着原图将被大量保留。较低值(如 0.8)会更保守,但创造力可能受限;较高值赋予 AI 更大自由度,但可能改变原图内容。


所需模型(下载链接)

  1. Qwen_Image_Edit-Q5_0.ggufhttps://huggingface.co/QuantStack/Qwen-Image-Edit-GGUF

  2. qwen2.5-vl-7b-it-q4_0.ggufhttps://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/tree/main/split_files/text_encoders

  3. qwen_image_vae.safetensorshttps://huggingface.co/QuantStack/Qwen-Image-Edit-GGUF

  4. Qwen-Image-Edit-Lightning-8steps-V1.0-bf16.safetensorshttps://huggingface.co/lightx2v/Qwen-Image-Lightning/tree/main


总结

此工作流程充分展现了 Qwen Image Edit 模型在图像外延任务上的强大能力。它消除了技术门槛,为您提供了一键式、简洁高效的解决方案,可在保持完美一致性的同时,创造性地扩展您的图像。无论是摄影师、数字艺术家,还是希望拓展创作边界的任何人,都值得一试。

如果您使用本工作流程,请分享您的成果!我非常期待看到您创作的作品。

此模型生成的图像

未找到图像。