Ovis-Image
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
HF | GH
ComfyUIを最新版(GitHub版)に更新してください => ComfyUIディレクトリに移動 -> ターミナルで git pull -> ComfyUIを再起動
Ovis-Imageは、アリババのチームが開発した魅力的な7Bパラメータのテキストから画像生成AIモデルです。このモデルは、テキストプロンプトを入力として画像を生成しますが、特に画像内のテキストの再現に優れており、単語が明確で、スペルが正しく、さまざまなフォントで整然と表示されるようにします。
ポスター、ロゴ、アプリのモックアップ、インフォグラフィックなどの作成に最適で、長文や不規則なアスペクト比でもテキストが鮮明で読みやすい必要があります。英語と中国語をどちらも優れた精度で処理し、ベンチマークではより大きなモデルを上回るクリアさと正確さを発揮します。
さらに、効率的で、1台の高性能GPUで低遅延で動作するため、巨大なハードウェアを必要とせずに実用的なアプリケーションに適しています。汎用画像生成にも優れていますが、テキストのレンダリングが最大の強みです。
これらのモデルは、利便性のためここで再配布されています。


