请在使用前安装 Python！！

此全自动标注工具使用当今最强大的大语言模型（LLM）自动为您的训练数据集生成标签。测试表明，使用 Gemini 2.0 Flash 生成的标签准确率可与人工手动标注相媲美。

1. 确保已安装 Python。 该标注工具提供两个版本：一个适用于 Google Gemini API，另一个适用于 OpenAI API。使用 Gemini API 版本，您可以使用 Google 的任何模型。如果您拥有 Google 账号，可从 Gemini AI Studio 免费获取 API 密钥——只需上网搜索相关教程即可！目前 Google 为每个账号提供免费配额，即使不付费，每天也可免费调用高达 1500 次 Gemini 2.0 Flash，完全足以满足图像标注需求！（注意：在某些地区使用 Gemini API 可能需要 VPN 或类似工具。）如果您拥有 OpenAI API 密钥（或任何兼容 OpenAI 的第三方 API），只需使用 OpenAI API 版本即可。

2. 解压后点击 start_webui.bat。 首次运行时，程序将自动安装所需依赖项。请确保至少有 500MB 的可用空间。依赖项安装完成后，Web 界面将自动打开。（启动程序时请确保关闭 VPN/代理，否则 Web 界面可能无法正常启动。）

3. 该工具支持自动批量图像标注和手动单张图像标注。

要运行自动批量图像标注，请在“图像文件夹”字段中输入您的训练集路径（例如：c:\my_training_set），然后点击页面上的“批量处理图像”按钮开始。生成的标签将保存为与对应图像同名的 .txt 文件，并存放于您的训练集文件夹内。如需中断处理，请点击旁边的“停止”按钮。

自动批量图像标注还支持多线程，每批最多可处理 40 张图像。若您的 API 每分钟请求数（RPM）限制足够高，一个包含 1000 张图像的训练集仅需运行 25 批次即可自动完成标注，可能只需几分钟。您可以在“最大并发图像数（批次大小）”字段中设置每批图像数量。（“批次间隔（秒）”是批次之间的延迟时间，默认值 5 秒通常足够。）若您希望逐张顺序处理图像，请将“最大并发图像数（批次大小）”设为 1，并将“批次间隔（秒）”设为 0。

4. 该工具还具备“上下文学习”模式（查找标有“incontext-learning”的页面）。此模式允许您上传两张参考图像及其对应标签，LLM 将从这些示例中学习标注风格，并将其应用到您的其他图像上。若您希望 LLM 按照您的特定要求标注（例如输出自然语言标签或 Danbooru 风格标签），强烈建议使用“上下文学习”页面。

5. 该工具还支持数据集预处理。 在此功能中，您可以输入介于 400,000 至 1,000,000 像素之间的目标总像素数（建议 600,000 像素或更高）。点击“运行”后，工具将裁剪您训练集中的图像，保持原始宽高比，使其符合设定的像素数。较小的图像可有效降低标注成本。（此功能不会对您的原始数据集造成任何影响，可放心使用。）

模型类型	其他
基础模型	Other
发布时间	11/28/2025

Auto Tagger

详情

下载文件

模型描述

请在使用前安装 Python！！

此模型生成的图像