Dataset Caption Tool for Comfyui
详情
下载文件
模型描述
13.08.
修复了一个小bug
更新:2025年8月9日
我之前在旧工作流中遇到了图像加载器的问题,因此我自行编写了一个自定义节点,可无错误地加载图像。
本次使用GPT进行图像描述生成,并结合自定义指令。
也可以替换为开源的视觉语言模型(VLM),但总体而言GPT效果最佳。
2024年10月24日更新:新增Joytag描述功能
2024年4月29日更新:我已将视觉模型从Moondream2更换为llava。
要使llava模型正常工作,必须安装Ollama。这将允许llava在本地运行,并通过本地API与ComfyUI通信。
Ollama GitHub:
2024年3月25日更新:已修复导致计数错误的bug。
Comfy Moondream Caption(ComfyUI数据集描述工具)
欢迎使用Comfy Moondream Caption,这是一个使用本地大语言模型(LMM)为图像生成描述的工具。请按以下步骤开始使用:

该工作流适用于最多9999张图像的数据集。
选择图像文件夹:
前往“folder_path”选项,选择存放图像的文件夹。请确保图像为支持格式(如PNG、JPEG)。
命名规范:
请确保所选文件夹中的图像按顺序编号,例如“0001.png”、“0002.png”等。此编号对正确处理至关重要。
启用批量描述:
要启用批量描述,请进入Comfy UI中的“Extra Options”(额外选项)部分。
选择“Auto Queue”以确保为所选文件夹中的所有图像生成描述。

生成描述:
设置好文件夹和选项后,点击“Que Prompt”按钮启动描述生成过程。
Comfy Moondream Caption将分析文件夹中的每张图像并为其生成描述。
后处理:
描述生成完成后,必须手动将起始索引重置为0。这可确保工具在处理下一个数据集时从头开始。


对其他数据集重复操作:
如果您有更多数据集需要处理,请选择包含新图像的文件夹并重复上述流程。
安装:
要设置此工作流,您需要Kijai开发的ComfyUI Moondream自定义节点。您可以在以下地址获取:https://github.com/kijai/ComfyUI-moondream



