Qwen-Image

详情

模型描述

2025年11月10日 - 请注意!由于稳定性问题,Qwen 已暂时停用。我们正在努力尽快恢复其在线服务!

我们很高兴发布 Qwen-Image,这是 Qwen 系列中的一个图像生成基础模型,在复杂文本渲染和精确图像编辑方面取得了显著突破。实验表明,该模型在图像生成与编辑方面具有强大的通用能力,尤其在文本渲染方面表现卓越,特别适用于中文。

其突出能力之一是跨多样图像实现高保真文本渲染。无论是拉丁字母语言如英语,还是表意文字如中文,Qwen-Image 都能精准保留字体细节、布局连贯性与上下文和谐性。文本并非简单叠加,而是无缝融入视觉结构之中。

除了文本,Qwen-Image 在通用图像生成方面同样表现出色,支持多种艺术风格。从写实场景到印象派绘画,从动漫美学到极简设计,该模型能灵活响应创意提示,成为艺术家、设计师和叙事者的多功能工具。

在图像编辑方面,Qwen-Image 远超简单调整,支持高级操作,如风格迁移、对象插入或移除、细节增强、图像内文本编辑,甚至人体姿态操控——所有操作均通过直观输入实现连贯输出。这种级别的控制力,让专业级编辑触手可及。

但 Qwen-Image 不仅能创建或编辑图像,更能理解图像。它支持一系列图像理解任务,包括目标检测、语义分割、深度与边缘(Canny)估计、新视角合成和超分辨率。这些能力虽技术上各不相同,但均可视为由深层视觉理解驱动的智能化图像编辑的特殊形式。

综合来看,这些特性使 Qwen-Image 不仅是一个生成精美图像的工具,更是一个集语言、布局与图像于一体、用于智能视觉创作与操控的综合性基础模型。

许可协议

Qwen-Image 采用 Apache 2.0 许可证。

原始文本与模型:https://huggingface.co/Qwen/Qwen-Image

此模型生成的图像

未找到图像。