Qwen-Image
Qwen_Image_fp8_e4m3fnQwen-Image Full BF16Qwen Image WorkflowQwen Lightning 8 Stepqwen_2.5_vl_7b_fp8_scaledQwen Image VAE
详情
下载文件
关于此版本
模型描述
2025年11月10日 - 请注意!由于稳定性问题,Qwen 已暂时停用。我们正在努力尽快恢复其在线服务!
我们很高兴发布 Qwen-Image,这是 Qwen 系列中的一个图像生成基础模型,在复杂文本渲染和精确图像编辑方面取得了显著突破。实验表明,该模型在图像生成与编辑方面具有强大的通用能力,尤其在文本渲染方面表现卓越,特别适用于中文。
其突出能力之一是跨多样图像实现高保真文本渲染。无论是拉丁字母语言如英语,还是表意文字如中文,Qwen-Image 都能精准保留字体细节、布局连贯性与上下文和谐性。文本并非简单叠加,而是无缝融入视觉结构之中。
除了文本,Qwen-Image 在通用图像生成方面同样表现出色,支持多种艺术风格。从写实场景到印象派绘画,从动漫美学到极简设计,该模型能灵活响应创意提示,成为艺术家、设计师和叙事者的多功能工具。
在图像编辑方面,Qwen-Image 远超简单调整,支持高级操作,如风格迁移、对象插入或移除、细节增强、图像内文本编辑,甚至人体姿态操控——所有操作均通过直观输入实现连贯输出。这种级别的控制力,让专业级编辑触手可及。
但 Qwen-Image 不仅能创建或编辑图像,更能理解图像。它支持一系列图像理解任务,包括目标检测、语义分割、深度与边缘(Canny)估计、新视角合成和超分辨率。这些能力虽技术上各不相同,但均可视为由深层视觉理解驱动的智能化图像编辑的特殊形式。
综合来看,这些特性使 Qwen-Image 不仅是一个生成精美图像的工具,更是一个集语言、布局与图像于一体、用于智能视觉创作与操控的综合性基础模型。
许可协议
Qwen-Image 采用 Apache 2.0 许可证。














