Dataset Caption Tool for Comfyui

詳細

ファイルをダウンロード

モデル説明

13.08.
小さなバグを修正

更新日:2025年9月8日

以前のワークフローでは画像ローダーに問題があったため、エラーなく画像を読み込むカスタムノードを自作しました。

今回は、GPTをキャプション生成に使用し、カスタム指示も併用しています。

オープンソースのVLMに置き換えることも可能ですが、全体的にGPTが最も優れています。

2024年10月24日更新:Joytagキャプションを追加

2024年4月29日更新:ビジョンモデルをMoondream2からllavaに変更しました。

llavaモデルを使用するには、Ollamaをインストールする必要があります。これにより、llavaをローカルで実行でき、ComfyUIはローカルAPI経由でllavaと通信できます。
Ollama GitHub:

2024年3月25日更新:誤ったカウントを引き起こしていたバグを修正しました。

Comfy Moondream Caption(ComfyUI用データセットキャプションツール)

Comfy Moondream Captionへようこそ。ローカルのLMMを使用して画像にキャプションを生成するためのツールです。以下の手順に従って開始してください:

このワークフローは、最大9999枚までの画像データセットに対応しています。

画像フォルダーの選択:

「folder_path」オプションに移動し、画像が格納されているフォルダーを選択してください。画像はサポートされている形式(例:PNG、JPEG)であることを確認してください。

命名規則:

選択したフォルダー内の画像は、順番に番号付けされている必要があります(例:"0001.png"、"0002.png" など)。この番号付けは正しく処理するために不可欠です。

バッチキャプションの有効化:

バッチキャプションを有効にするには、Comfy UIの「Extra Options」セクションに移動してください。

「Auto Queue」を選択して、選択したフォルダー内のすべての画像に対してキャプションを生成します。

キャプションの生成:

フォルダーとオプションを設定したら、「Que Prompt」ボタンをクリックしてキャプション生成プロセスを開始します。

Comfy Moondream Captionは、フォルダー内の各画像を分析し、キャプションを生成します。

後処理:

キャプション生成プロセスが完了したら、開始インデックスを手動で0にリセットしてください。これにより、次回のデータセット処理の際にツールが先頭から処理を再開します。

追加のデータセットでの繰り返し:

さらに分析するデータセットがある場合は、新しい画像が含まれるフォルダーを選択して同じ手順を繰り返してください。

インストール:

このワークフローを設定するには、Kijaiが開発したComfyUI Moondreamカスタムノードが必要です。以下から入手できます:https://github.com/kijai/ComfyUI-moondream

このモデルで生成された画像

画像が見つかりません。