Qwen-Image
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
Qwen, 온사이트 생성 기능으로 이제 사용 가능! 이는 실험용 빌드입니다. 가격과 품질은 변경될 수 있습니다.
우리는 Qwen 시리즈의 이미지 생성 기반 모델인 Qwen-Image를 출시하게 되어 기쁩니다. 이 모델은 복잡한 텍스트 렌더링과 정밀한 이미지 편집 분야에서 큰 진전을 이루었습니다. 실험 결과, 이미지 생성 및 편집 전반에 뛰어난 일반성과 함께, 특히 중국어 텍스트 렌더링에서 뛰어난 성능을 보여줍니다.
이 모델의 가장 두드러진 기능 중 하나는 다양한 이미지에서 고신뢰도 텍스트 렌더링입니다. 영어와 같은 알파벳 언어나 중국어와 같은 로고그라픽 문자를 막론하고, Qwen-Image는 타이포그래피 세부사항, 레이아웃 일관성, 맥락적 조화를 놀라울 정도로 정확하게 유지합니다. 텍스트는 단순히 겹쳐지는 것이 아니라 시각적 구조에 자연스럽게 통합됩니다.
텍스트 이외에도, Qwen-Image는 다양한 예술 스타일을 지원하는 일반적인 이미지 생성에서 뛰어납니다. 사진과 같은 사실적인 장면에서 인상파 회화, 애니메이션 스타일에서 미니멀리즘 디자인에 이르기까지, 모델은 창의적인 프롬프트에 유연하게 적응하여 예술가, 디자이너, 스토리텔러에게 다재다능한 도구가 됩니다.
이미지 편집의 경우, Qwen-Image는 단순한 조정을 넘어서 고급 작업을 가능하게 합니다. 스타일 전이, 객체 삽입 또는 제거, 디테일 강화, 이미지 내 텍스트 편집, 심지어 인간 자세 조작까지도 직관적인 입력과 일관된 출력으로 구현합니다. 이러한 수준의 제어는 일반 사용자에게도 전문가급 편집 기능을 제공합니다.
그러나 Qwen-Image는 단순히 생성하거나 편집하는 데 그치지 않고, 이해합니다. 객체 탐지, 의미적 분할, 깊이 및 엣지(Canny) 추정, 신규 시점 합성, 초해상도 등 이미지 이해 작업을 지원합니다. 이 기능들은 기술적으로는 별개이지만, 모두 심층적인 시각적 이해를 바탕으로 하는 전문적인 이미지 편집 형태로 볼 수 있습니다.
이러한 기능들이 결합되어 Qwen-Image는 단순히 예쁜 이미지를 생성하는 도구를 넘어, 언어, 레이아웃, 이미지가 융합되는 지능형 시각 창작 및 조작을 위한 포괄적인 기반 모델이 됩니다.
라이선스 계약
Qwen-Image는 Apache 2.0 라이선스 하에 제공됩니다.

