LlamaCaption2_AngryHamster

详情

模型描述

LlamaCaption2 是一个基于图形界面的图像描述生成工具,使用本地 AI 模型为图片生成自定义描述。

原作者:LlamaScribe by LamEmy |

修订与升级:AngryHamster

原开发:https://civitai.com/user/LamEmy

修订与升级:AngryHamster

LlamaCaption2 的 GitHub 页面:

git clone github.com/robertinosro/LlamaCaption2_AngryHamster


功能

  • 批量处理多张图片
  • 生成由 AI 驱动的图像描述
  • 对描述应用自定义格式
  • 用户友好的界面
  • 支持本地 Ollama 模型
  • 一次性处理输入文件夹中的所有图片!

快速入门:安装要求

  1. 在您的系统上安装 Ollama(无需安装 Python)

  2. 已安装并本地运行 Ollama

  3. https://ollama.com/library/llama3.2-vision

    • 一个兼容的视觉模型(如 llama3.2-vision)用于图像分析
    • 一个兼容的文本模型(如 qwen)用于描述优化
  4. 在主文件夹中找到 LlamaScribe.exe 可执行文件,启动该文件,开始描述吧!

快速上手

  1. 启动 LlamaScribe.exe

  2. 应用程序将打开,标题为:“LlamaScribe by LamEmy | Revised & Upgraded by AngryHamster (Civitai)”

基本使用

  1. 主标签页

    • 选择包含您图片的文件夹
    • 选择您偏好的 Ollama 视觉模型
    • 点击“开始处理”以生成图片描述
  2. 高级标签页

    • 配置系统提示词
    • 调整 AI 模型的其他设置
  3. 格式标签页

    • 启用/禁用描述前缀和后缀
    • 自定义前缀文本:“A photo of a woman, bloobikkx1, curvy blonde with (a well-defined neck:1.3) and (natural proportions:1.2), ”
    • 自定义后缀文本:“ (masterpiece, ultra-realistic, high-definition, 8K, cinematic lighting),(professional photography:1.4), (sharp focus:1.2), (studio lighting:1.2), (clear details:1.3), (professional atmosphere:1.3)”

输出

  • 应用程序将处理所选文件夹中的所有图片

  • 每张图片将获得一个符合以下格式的描述:

    • [前缀] + [AI生成的描述] + [后缀]
  • 描述将与图片保存在同一目录下

主文件夹中包含更详细的 README 文件!

此模型生成的图像

未找到图像。