Florence2を使用します。モデルを選択するだけで、必要なファイルがダウンロードされ、読み込まれた画像の説明が表示されます。
画像を読み込むと、Florence2がその画像に応じたプロンプトを生成します。