Qwen-Image
Qwen_Image_fp8_e4m3fnQwen-Image Full BF16Qwen Image WorkflowQwen Lightning 8 Stepqwen_2.5_vl_7b_fp8_scaledQwen Image VAE
详情
下载文件
关于此版本
模型描述
Qwen 现已支持本地生成!请注意,此为实验性版本!价格和质量可能随时调整。
我们很高兴推出 Qwen-Image,这是 Qwen 系列中的图像生成基础模型,在复杂文本渲染和精确图像编辑方面取得了显著突破。实验表明,该模型在图像生成与编辑方面具备强大的通用能力,尤其在文本渲染方面表现卓越,特别适用于中文场景。
其突出能力之一是跨多种图像实现高保真文本渲染。无论是拉丁字母语言如英语,还是表意文字如中文,Qwen-Image 均能精准保留字体细节、布局连贯性与上下文和谐性,效果惊人。文本并非简单叠加,而是无缝融入视觉整体。
除了文本,Qwen-Image 在通用图像生成方面同样出色,支持多种艺术风格。从写实场景到印象派绘画,从动漫风格到极简设计,该模型能流畅响应各类创意提示,成为艺术家、设计师和叙事者的多功能工具。
在图像编辑方面,Qwen-Image 远超简单调整,支持高级操作,如风格迁移、对象添加或移除、细节增强、图像内文本编辑,甚至人体姿态操控——所有操作均通过直观输入实现连贯输出。这种级别的控制力,让专业级编辑触手可及。
但 Qwen-Image 不仅能生成或编辑图像,它更懂得理解图像。它支持一系列图像理解任务,包括物体检测、语义分割、深度与边缘(Canny)估计、新视角合成和超分辨率。这些能力虽技术上各不相同,但均可视为基于深度视觉理解的智能化图像编辑的特殊形式。
综合以上特性,Qwen-Image 不仅是一款生成精美图像的工具,更是一个集语言、布局与图像于一体的综合性智能视觉创作与操控基础模型。
许可协议
Qwen-Image 采用 Apache 2.0 许可协议。














