LoRA Dataset Caption Aid with Ollama Vision Uncensored
详情
下载文件
关于此版本
模型描述
此工作流程用于在为角色LoRA创建标题时提供起点。您输入一张图像,它将分析图像并提供一个全面的描述,专为角色LoRA设计,应包含正确标注所需的所有相关细节。
我发现了一个具备视觉能力且未受审查的优质Ollama模型,并向其输入了关于如何为角色LoRA撰写恰当标题的详细提示。该Ollama模型大小约为7GB,若单独运行,几乎可在任何GPU上运行。
此外,新增了一个“提示”框,以便用户在特殊情况下(如极端特写)为视觉模型提供提示,因为若AI未获得至少最基础的上下文,图像分析可能会出错。大多数情况下请保持该框为空。
我还添加了一些带有最佳标题撰写技巧的Markdown注释。

