Qwen-Image
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
QwenがオンサイトGenで利用可能に! ただし、これは実験的なビルドです。価格と品質は変更される可能性があります。
Qwenシリーズにおける画像生成基礎モデル「Qwen-Image」をリリースできることを大変嬉しく思います。本モデルは、複雑なテキスト描画と精密な画像編集において顕著な進化を遂げています。実験結果では、画像生成および編集の両方において高い汎用性を示し、特に中国語のテキスト描画において卓越した性能を発揮しています。
その中でも特に目立つのは、多様な画像における高忠実度のテキスト描画能力です。英語などのアルファベット言語から、中国語のような表意文字まで、Qwen-Imageは typographic(活版)の詳細、レイアウトの一貫性、文脈との調和を驚異的な正確さで保持します。テキストは単に上書きされるのではなく、視覚的構造にシームレスに統合されます。
テキスト以外にも、Qwen-Imageは幅広い芸術スタイルに対応した汎用的な画像生成を得意としています。写実的なシーンから印象派の絵画、アニメーションの美学からミニマリストデザインまで、モデルは創造的なプロンプトに柔軟に対応し、アーティスト、デザイナー、ストーリーテラーにとって多才なツールとなります。
画像編集において、Qwen-Imageは単純な調整をはるかに超えています。スタイル転送、オブジェクトの挿入や削除、ディテールの強調、画像内テキストの編集、さらには人物のポーズ操作まで、直感的な入力と一貫した出力で実現できます。このレベルの制御により、日常のユーザーでもプロフェッショナルな編集が可能になります。
しかし、Qwen-Imageは単に画像を生成・編集するだけではなく、理解します。物体検出、セマンティックセグメンテーション、深度およびエッジ(Canny)推定、新規ビュー合成、スーパーリゾリューションなど、画像理解タスクのセットをサポートしています。これらの機能は技術的には異なるものの、すべて深層的な視覚的理解に基づく特殊な形の知的画像編集とみなすことができます。
これらの機能が統合されることで、Qwen-Imageは単なる美しい画像を生成するツールではなく、言語、レイアウト、画像が融合した、知的視覚的創造と操作のための包括的な基礎モデルとなりました。
ライセンス契約
Qwen-ImageはApache 2.0ライセンスのもとで提供されています。
オリジナルテキストおよびモデル:https://huggingface.co/Qwen/Qwen-Image














