Auto Tagger
详情
下载文件
模型描述
请在使用前安装 Python!!
此全自动标注工具使用当今最强大的大语言模型(LLM)自动为您的训练数据集生成标签。测试表明,使用 Gemini 2.0 Flash 生成的标签准确率可与人工手动标注相媲美。
1. 确保已安装 Python。 该标注工具提供两个版本:一个适用于 Google Gemini API,另一个适用于 OpenAI API。使用 Gemini API 版本,您可以使用 Google 的任何模型。如果您拥有 Google 账号,可从 Gemini AI Studio 免费获取 API 密钥——只需上网搜索相关教程即可!目前 Google 为每个账号提供免费配额,即使不付费,每天也可免费调用高达 1500 次 Gemini 2.0 Flash,完全足以满足图像标注需求!(注意:在某些地区使用 Gemini API 可能需要 VPN 或类似工具。)如果您拥有 OpenAI API 密钥(或任何兼容 OpenAI 的第三方 API),只需使用 OpenAI API 版本即可。
2. 解压后点击 start_webui.bat。 首次运行时,程序将自动安装所需依赖项。请确保至少有 500MB 的可用空间。依赖项安装完成后,Web 界面将自动打开。(启动程序时请确保关闭 VPN/代理,否则 Web 界面可能无法正常启动。)
3. 该工具支持自动批量图像标注和手动单张图像标注。
要运行自动批量图像标注,请在“图像文件夹”字段中输入您的训练集路径(例如:c:\my_training_set),然后点击页面上的“批量处理图像”按钮开始。生成的标签将保存为与对应图像同名的 .txt 文件,并存放于您的训练集文件夹内。如需中断处理,请点击旁边的“停止”按钮。
自动批量图像标注还支持多线程,每批最多可处理 40 张图像。若您的 API 每分钟请求数(RPM)限制足够高,一个包含 1000 张图像的训练集仅需运行 25 批次即可自动完成标注,可能只需几分钟。您可以在“最大并发图像数(批次大小)”字段中设置每批图像数量。(“批次间隔(秒)”是批次之间的延迟时间,默认值 5 秒通常足够。)若您希望逐张顺序处理图像,请将“最大并发图像数(批次大小)”设为 1,并将“批次间隔(秒)”设为 0。
4. 该工具还具备“上下文学习”模式(查找标有“incontext-learning”的页面)。此模式允许您上传两张参考图像及其对应标签,LLM 将从这些示例中学习标注风格,并将其应用到您的其他图像上。若您希望 LLM 按照您的特定要求标注(例如输出自然语言标签或 Danbooru 风格标签),强烈建议使用“上下文学习”页面。
5. 该工具还支持数据集预处理。 在此功能中,您可以输入介于 400,000 至 1,000,000 像素之间的目标总像素数(建议 600,000 像素或更高)。点击“运行”后,工具将裁剪您训练集中的图像,保持原始宽高比,使其符合设定的像素数。较小的图像可有效降低标注成本。(此功能不会对您的原始数据集造成任何影响,可放心使用。)
