Qwen-Image

詳細

ファイルをダウンロード

モデル説明

2025年11月10日 - ご注意ください! Qwenは安定性の問題により一時的に無効化されています。できるだけ早く再稼働できるよう対応中です!

私たちは、Qwenシリーズの画像生成基盤モデルであるQwen-Imageをリリースできることを心より喜ばしく思っています。このモデルは、複雑なテキストのレンダリングと精密な画像編集において顕著な進歩を遂げています。実験結果では、画像生成および編集の両方において優れた汎用能力を示しており、特に中国語のテキストレンダリングにおいて卓越した性能を発揮しています。

その中でも特に注目すべき能力は、多様な画像における高精細なテキストレンダリングです。英語のようなアルファベット言語から、中国語のような表意文字まで、Qwen-Imageは文字のタイポグラフィ的詳細、レイアウトの一貫性、文脈との調和を驚異的な精度で保持します。テキストは単に上書きされるのではなく、視覚的構造にシームレスに統合されます。

テキスト以外にも、Qwen-Imageは幅広い芸術スタイルに対応した汎用的な画像生成を得意としています。写実的な風景から印象派の絵画、アニメ風の美学からミニマリストなデザインまで、モデルは創造的なプロンプトに柔軟に対応し、アーティスト、デザイナー、物語制作者にとって多目的なツールとなります。

画像編集において、Qwen-Imageは単純な調整を超えて高度な操作を可能にします。スタイル転送、オブジェクトの挿入や削除、ディテールの強化、画像内のテキスト編集、さらには人物のポーズ操作など、直感的な入力と一貫性のある出力で実現します。このレベルの制御により、一般ユーザーでもプロフェッショナルな編集が可能になります。

しかし、Qwen-Imageは単に画像を生成・編集するだけでなく、理解もできます。物体検出、セマンティックセグメンテーション、深度およびエッジ(Canny)推定、新規ビュー合成、スーパーレゾリューションなど、画像理解タスクのセットをサポートしています。これらは技術的には異なる機能ですが、すべて深層的な視覚的理解に基づく特殊な形の知的画像編集と見なすことができます。

これらの機能が統合されることで、Qwen-Imageは単なる美しい画像を生成するツールではなく、言語、レイアウト、画像が融合した、知的視覚的創造と操作のための包括的な基盤モデルとなります。

ライセンス契約

Qwen-ImageはApache 2.0ライセンスのもとで提供されています。

オリジナルテキストおよびモデル: https://huggingface.co/Qwen/Qwen-Image

このモデルで生成された画像

画像が見つかりません。