Caption Creator [UPDATED]

详情

模型描述

Caption Creator v7.2(由 MM744 制作)

体验数据集创建的下一代进化——Caption Creator v7.2,现已全面升级用户界面,并新增强大功能。这款快速、完全便携的图形工具,旨在以无与伦比的便捷性生成卓越的图像描述与标签,是为 Pony、SDXL 和 Illustrious 等 AI 模型创建高质量数据集的终极助手,完美适用于 LoRA 训练与高级图像提示。

应用程序完全在您的本地机器上运行,确保隐私与无审查输出。内置 Python 环境与精致直观的界面,让您上手从未如此简单。

截图:

功能:

  • 双生成模式:无缝切换生成详细描述或简洁逗号分隔的标签
  • 智能标签格式化:自动清理 AI 输出的标签,形成完美的单行逗号分隔列表,移除注释与多余格式。
  • 强大的批量处理:单次运行即可处理整个文件夹的图片,并提供清晰的画廊式进度视图。
  • 便携且自包含:无需安装,仅需一个文件夹即可运行,内置 Python 环境,开箱即用。
  • 无审查本地 AI:使用本地运行的模型,无需内容过滤,获得完全的创作自由。
  • 全面界面重设计:采用优雅现代的深色主题界面,专为专业工作流打造,响应迅速。
  • LM Studio 集成:高级用户可直接连接正在运行的 LM Studio 实例,使用任何兼容模型。
  • 直接粘贴图像:只需从剪贴板粘贴图像(Ctrl+V),即可立即处理。
  • 交互式模型管理:在应用内直观的模态界面中直接下载、删除和管理模型。
  • 内置 ZIP 归档:一键将整个生成结果(图片与文本文件)保存为单个 ZIP 压缩包。
  • 提示增强:实时向 AI 添加额外上下文或指令,无需编辑配置文件即可引导输出。
  • 直观控制:以自定义滑块和开关替代基础输入,提供更触感化、高效的用户体验。
  • VRAM 优化:选择适配不同 GPU 显存容量的模型(5GB、8GB、10GB、20GB)。
  • 低显存模式:专用复选框,进一步降低内存受限系统中的显存占用。
  • 保持模型加载:任务完成后保留 AI 模型在 VRAM 中,大幅加速后续生成。
  • 自动关机:长批次处理完成后自动关闭电脑。
  • 完整 Kohya_SS 导出:启用并配置 Kohya_SS 文件夹结构导出,生成可直接拖放的训练数据集。
  • 灵活格式化:使用触发词、定义最大词数,并将描述格式化为单一段落。
  • 便捷访问:一键复制生成文本到剪贴板,或直接从界面打开输出文件夹。

使用方法:

  1. 下载并解压:下载程序并解压 .zip 压缩包至一个文件夹。
  2. 运行应用程序:双击 Caption Creator.exe 启动程序。
  3. 管理您的模型
    • 点击“模型 / VRAM 配置”按钮打开模型选择面板。
    • 使用内置模型:若某模型未标记为“可用”,请点击其旁边的下载图标(📥),应用将自动下载并安装。
    • 使用 LM Studio:选择“自定义(LM Studio)”选项,点击“连接”以链接您的运行中 LM Studio 服务器。
    • 从列表中选择所需模型,使其变为激活状态。
  4. 加载您的图像
    • 单图模式拖放图像、点击浏览,或粘贴剪贴板中的图像。
    • 批量模式拖放多张图像,或点击选择一组文件。
  5. 配置并生成
    • 选择生成类型(描述标签)。
    • 调整设置,如最大词数、触发词,或启用低显存模式与 Kohya_SS 导出。
    • 点击生成
  6. 查看输出:在状态窗口中观察实时进度。生成的文本与图像将显示在右侧面板,并自动保存至 output 文件夹,按批次整齐归类。

输出示例:

描述(启用单段落格式):

这是一幅来自电子游戏《街头霸王 II》的女性角色数字插画。她拥有金色长发,编成两条辫子,每条都绑着红色丝带。肤色白皙,蓝色双眼专注地直视前方。头戴一顶红色贝雷帽,正面中央有一颗白色纽扣,身穿绿色无袖背心,佩戴红色露指手套。右臂向前伸展,拳头紧握,仿佛正准备出拳或投掷拳头。左臂略微后置于身体后方,也向前延伸,但位置不如右臂突出。背景为从顶部深灰到底部黑色的渐变,与角色明亮的服装形成鲜明对比。角色表情坚定专注,嘴角微张,露出细小的牙齿。通过手臂与肩膀的清晰线条,可明显看出其肌肉发达的体魄。整体插画风格高度细致且富有动感,符合《街头霸王》系列的艺术设计。图像两侧及上下边缘由灰色边框框定,形成矩形构图,增强主体的深度与焦点。整幅画面传达出力量感与战斗准备状态。

标签:

数字艺术,女性角色,肌肉健硕,绿色背心,带白色纽扣的红色贝雷帽,红色露指手套,编成辫子的金发,专注神情,右臂前伸,咬紧牙齿,深蓝渐变背景,鲜艳色彩,动漫风格,强劲姿势,上半身,动态光影,高对比度,Illustrious 质量,格斗游戏角色,卡米拉(街头霸王),严肃神态,自信姿态,运动员体格,坚定表情,粗犷轮廓,写实阴影,生动细节,中近景,动作姿势,角色设计,电子游戏美学,鲜明面部特征,动态构图,充满活力的姿势,凶猛态度,富有表现力的眼睛,强势姿态,战斗准备外观

标签:

#caption-creator #dataset #tagging #portable #uncensored #batch-processing #memory-optimized

在 Patreon 上支持我们 — https://www.patreon.com/MM744

此模型生成的图像

未找到图像。