Caption Creator [v7.3]
详情
下载文件
模型描述
Caption Creator v7.3(由 MM744 创建)
体验数据集创建的下一代演进——Caption Creator v7.3,现已全面升级用户界面,并新增强大功能。这款快速、完全便携的图形工具,旨在以无与伦比的便捷性生成卓越的图像说明与标签。它是为 Pony、SDXL 和 Illustrious 等 AI 模型创建高质量数据集的终极助手,完美适用于 LoRA 训练和高级图像提示。
该应用程序完全在您的本地机器上运行,确保隐私与无审查输出。内置 Python 环境与精致直观的界面,让您上手从未如此简单。
截图:


功能:
- 双生成模式:无缝切换生成详细说明或简洁的逗号分隔标签。
- 智能标签格式化:自动清理 AI 输出的标签,生成完美、单行、逗号分隔的列表,移除注释与无关格式。
- 强大批量处理:单次运行即可处理整文件夹图像,并提供清晰的画廊式进度视图。
- 便携且自包含:无需安装。仅需一个文件夹即可运行,内置 Python 环境,开箱即用。
- 无审查本地 AI:使用本地运行的模型,无内容过滤,获得完全创作自由。
- 全面界面重构:采用现代、流畅、响应式的深色主题界面,专为专业工作流设计。
- LM Studio 集成:高级用户可直接连接正在运行的 LM Studio 实例,使用任何兼容模型。
- 直接图像粘贴:只需从剪贴板粘贴图像(Ctrl+V),即可立即处理。
- 交互式模型管理:通过应用内直观的模态界面直接下载、删除和管理模型。
- 内置 ZIP 压缩:一键将整个生成结果(图像与文本文件)保存为单个 ZIP 压缩包。
- 提示增强:可实时向 AI 添加额外上下文或指令,无需修改配置文件即可引导输出。
- 直观控件:以自定义滑块与开关取代基础输入,提供更触感化、高效的用户体验。
- VRAM 优化:可选择适配不同 GPU 显存容量的模型(5GB、8GB、10GB、20GB)。
- 低显存模式:专属复选框,进一步降低内存受限系统的显存占用。
- 保持模型加载:任务完成后保留 AI 模型在显存中,显著加速后续生成。
- 自动关机:长批量处理完成后自动关闭您的电脑。
- 完整 Kohya_SS 导出:启用并配置 Kohya_SS 文件夹结构导出,生成即拖即用的训练数据集。
- 灵活格式化:使用触发词、定义最大词数,并将说明格式化为单段落。
- 便捷访问:一键将生成文本复制到剪贴板,或直接从界面打开输出文件夹。
使用方法:
- 下载并解压:下载程序,将 .zip 压缩包解压至一个文件夹。
- 运行程序:双击 Caption Creator.exe 启动程序。
- 管理您的模型:
- 点击“模型 / VRAM 配置”按钮打开模型选择面板。
- 使用内置模型:若模型未标记为“可用”,点击其旁边的下载图标(📥),程序将自动下载并安装。
- 使用 LM Studio:选择“自定义(LM Studio)”选项,点击“连接”以链接至您正在运行的 LM Studio 服务器。
- 从列表中选择所需模型,使其激活。
- 加载您的图像:
- 单图模式:拖放图像、点击浏览,或粘贴剪贴板中的图像。
- 批量模式:拖放多个图像,或点击选择一组文件。
- 配置并生成:
- 选择生成类型(说明 或 标签)。
- 调整设置,如最大词数、触发词,或启用低显存模式、Kohya_SS 导出等选项。
- 点击生成。
- 查看输出:在状态窗口中观察实时进度。生成的文本和图像将显示在右侧面板,并自动保存至 output 文件夹,按批次整齐归类。
输出示例:
说明(启用单段落格式):
该图像是来自电子游戏《街头霸王II》的女性角色数字插画。她拥有一头金色长发,编成两条发辫,每条发辫均用红色丝带系结。她的肤色白皙,双眼湛蓝,目光坚定地直视前方。她头戴一顶红色贝雷帽,帽前中央饰有白色纽扣,身穿绿色无袖背心,佩戴红色无指手套。右臂向前伸展,拳头紧握,仿佛正准备出拳或已挥出重击;左臂略微后移,同样向前延伸,但位置不那么突出。背景为从顶部深灰渐变至底部纯黑的渐变色,与角色鲜艳的服饰形成鲜明对比。角色表情坚定专注,嘴角微张,露出细小牙齿。其肌肉线条通过手臂与肩部的清晰轮廓清晰可见。整体插画风格高度细致且充满动感,符合《街头霸王》系列一贯的艺术设计。图像两侧及上下边缘均以灰色边框框定,形成矩形构图,这种框定效果增强了画面的深度与对中心角色的聚焦。整幅图像传递出力量感与战斗准备的气势。
标签:
digital art, female character, muscular build, green tank top, red beret with white button, red fingerless gloves, blonde hair in braid, intense expression, right arm extended forward, clenched teeth, dark blue gradient background, vibrant colors, anime style, strong pose, upper body, dynamic lighting, high contrast, Illustrious quality, fighting game character, Camilla (Street Fighter), serious demeanor, confident stance, athletic physique, determined look, bold outlines, realistic shading, vivid details, medium close-up shot, action pose, character design, video game aesthetics, strong facial features, dynamic composition, energetic pose, fierce attitude, expressive eyes, powerful stance, combat-ready appearance
标签:
#caption-creator #dataset #tagging #portable #uncensored #batch-processing #memory-optimized
官方 GitHub - https://github.com/Merserk/Caption-Creator
支持 Patreon - https://www.patreon.com/MM744


