Caption Creator [UPDATED]
详情
下载文件
模型描述
Caption Creator v7.2(由 MM744 制作)
体验数据集创建的下一代进化——Caption Creator v7.2,现已全面升级用户界面,并新增强大功能。这款快速、完全便携的图形工具,旨在以无与伦比的便捷性生成卓越的图像描述与标签,是为 Pony、SDXL 和 Illustrious 等 AI 模型创建高质量数据集的终极助手,完美适用于 LoRA 训练与高级图像提示。
应用程序完全在您的本地机器上运行,确保隐私与无审查输出。内置 Python 环境与精致直观的界面,让您上手从未如此简单。
截图:



功能:
- 双生成模式:无缝切换生成详细描述或简洁逗号分隔的标签。
- 智能标签格式化:自动清理 AI 输出的标签,形成完美的单行逗号分隔列表,移除注释与多余格式。
- 强大的批量处理:单次运行即可处理整个文件夹的图片,并提供清晰的画廊式进度视图。
- 便携且自包含:无需安装,仅需一个文件夹即可运行,内置 Python 环境,开箱即用。
- 无审查本地 AI:使用本地运行的模型,无需内容过滤,获得完全的创作自由。
- 全面界面重设计:采用优雅现代的深色主题界面,专为专业工作流打造,响应迅速。
- LM Studio 集成:高级用户可直接连接正在运行的 LM Studio 实例,使用任何兼容模型。
- 直接粘贴图像:只需从剪贴板粘贴图像(Ctrl+V),即可立即处理。
- 交互式模型管理:在应用内直观的模态界面中直接下载、删除和管理模型。
- 内置 ZIP 归档:一键将整个生成结果(图片与文本文件)保存为单个 ZIP 压缩包。
- 提示增强:实时向 AI 添加额外上下文或指令,无需编辑配置文件即可引导输出。
- 直观控制:以自定义滑块和开关替代基础输入,提供更触感化、高效的用户体验。
- VRAM 优化:选择适配不同 GPU 显存容量的模型(5GB、8GB、10GB、20GB)。
- 低显存模式:专用复选框,进一步降低内存受限系统中的显存占用。
- 保持模型加载:任务完成后保留 AI 模型在 VRAM 中,大幅加速后续生成。
- 自动关机:长批次处理完成后自动关闭电脑。
- 完整 Kohya_SS 导出:启用并配置 Kohya_SS 文件夹结构导出,生成可直接拖放的训练数据集。
- 灵活格式化:使用触发词、定义最大词数,并将描述格式化为单一段落。
- 便捷访问:一键复制生成文本到剪贴板,或直接从界面打开输出文件夹。
使用方法:
- 下载并解压:下载程序并解压 .zip 压缩包至一个文件夹。
- 运行应用程序:双击 Caption Creator.exe 启动程序。
- 管理您的模型:
- 点击“模型 / VRAM 配置”按钮打开模型选择面板。
- 使用内置模型:若某模型未标记为“可用”,请点击其旁边的下载图标(📥),应用将自动下载并安装。
- 使用 LM Studio:选择“自定义(LM Studio)”选项,点击“连接”以链接您的运行中 LM Studio 服务器。
- 从列表中选择所需模型,使其变为激活状态。
- 加载您的图像:
- 单图模式:拖放图像、点击浏览,或粘贴剪贴板中的图像。
- 批量模式:拖放多张图像,或点击选择一组文件。
- 配置并生成:
- 选择生成类型(描述 或 标签)。
- 调整设置,如最大词数、触发词,或启用低显存模式与 Kohya_SS 导出。
- 点击生成。
- 查看输出:在状态窗口中观察实时进度。生成的文本与图像将显示在右侧面板,并自动保存至 output 文件夹,按批次整齐归类。
输出示例:
描述(启用单段落格式):
这是一幅来自电子游戏《街头霸王 II》的女性角色数字插画。她拥有金色长发,编成两条辫子,每条都绑着红色丝带。肤色白皙,蓝色双眼专注地直视前方。头戴一顶红色贝雷帽,正面中央有一颗白色纽扣,身穿绿色无袖背心,佩戴红色露指手套。右臂向前伸展,拳头紧握,仿佛正准备出拳或投掷拳头。左臂略微后置于身体后方,也向前延伸,但位置不如右臂突出。背景为从顶部深灰到底部黑色的渐变,与角色明亮的服装形成鲜明对比。角色表情坚定专注,嘴角微张,露出细小的牙齿。通过手臂与肩膀的清晰线条,可明显看出其肌肉发达的体魄。整体插画风格高度细致且富有动感,符合《街头霸王》系列的艺术设计。图像两侧及上下边缘由灰色边框框定,形成矩形构图,增强主体的深度与焦点。整幅画面传达出力量感与战斗准备状态。
标签:
数字艺术,女性角色,肌肉健硕,绿色背心,带白色纽扣的红色贝雷帽,红色露指手套,编成辫子的金发,专注神情,右臂前伸,咬紧牙齿,深蓝渐变背景,鲜艳色彩,动漫风格,强劲姿势,上半身,动态光影,高对比度,Illustrious 质量,格斗游戏角色,卡米拉(街头霸王),严肃神态,自信姿态,运动员体格,坚定表情,粗犷轮廓,写实阴影,生动细节,中近景,动作姿势,角色设计,电子游戏美学,鲜明面部特征,动态构图,充满活力的姿势,凶猛态度,富有表现力的眼睛,强势姿态,战斗准备外观
标签:
#caption-creator #dataset #tagging #portable #uncensored #batch-processing #memory-optimized
在 Patreon 上支持我们 — https://www.patreon.com/MM744



