Gemini, prompt generator
详情
下载文件
关于此版本
模型描述
使用自定义LLM提示词,分析图像并输出适合i2v模型的提示结构。
+虽然也可用于Hunyuan,但建议排除与摄像机运动相关的提示词。
同时,请将您的API密钥填入位于 ComfyUI_windows_portable\ComfyUI\custom_nodes\comfyui-ollamagemini\config.json 的JSON文件中。
25.05.15 - 由于Gemini Pro版本的免费额度已不可用,现在必须仅使用Flash版本(2.0 flash 或 2.5 flash)。
25.05.26 - 目前,最新版的gemini flash为 gemini-2.5-flash-preview-05-20。
[更新日志]
25.08.23/Gemini I2V提示词用于Wan2.2 V2(txt文件)
我修改了一个用于i2v的越狱提示词。测试基于Gemini 2.5 Pro和2.5 Flash模型的全裸女性图像。然而,如果您输入英文文本,很可能被审查 -> 请尝试使用非英语语言提交请求。
25.07.30/Gemini I2V提示词用于Wan2.2 V1(txt文件)[提示词被审查]
Gemini 2.5 Pro/2.5 Flash模型也可分析NSFW图像。
此功能类似于RP,它是专为提供高级审查缓解而设计的NSFW RP提示词版本。
25.07.01/Gemini视频/图像字幕UI测试版
该工具使用队列处理多个视频和图像文件,具备三阶段字幕生成流程(单帧、综合摘要、最终重写),为每个文件生成清晰的.txt字幕和详细.json日志。
您可完全控制流程:通过FPS或总帧数调整采样帧;自定义所有提示词并保存为模板;提供可选的视频分割模式,适用于超长文件。
内置强大的故障恢复系统,可自动轮换多个API密钥和模型,避免限流错误并确保任务完成。您还可通过设置API延迟和并发工作线程微调性能。
通过直观的GUI管理一切,并支持实时日志记录。所有设置将在退出时保存,启动时自动加载。
要运行此工具,需使用以下命令安装所需库:
pip install PyQt5 opencv-python google-generativeai
请注意,由于一个非预期的逻辑问题,当前版本中的“开始处理”和“停止处理”按钮以及输出路径可能存在使用不便。该问题将在未来更新中改进。
25.06.30/独立Gemini UI v2
我提升了UI的便捷性,模板现已包含WAN 2.1 i2i v1.21b 和 FLUX kontext i2i提示词。使用本程序前,需通过以下命令安装必要库:pip install customtkinter google-generativeai pillow pyperclip googletrans==4.0.0-rc1 requests
25.05.30/Wan2.1 I2V v1.21b
i2v更新:精确动作控制(新语法/结构),降低摄像机影响以聚焦运动;可能增加NSFW拒绝率。
25.05.21/独立Gemini UI(v1.1)- 已更新现有ZIP文件。如需最新版本,请重新下载。
默认提示词已修改,支持正常使用gemini-2.0-flash和gemini-2.5-flash-preview-04-17版本。
然而,NSFW图像分析仅在gemini-2.0-flash上可用(但有时2.5 flash也可用),偶尔可能出现分析失败情况。(如遇此情况,请重试,一定可以成功。)
此外,新增了最终提示词翻译功能。因此,现有安装命令将按以下指令更新:
pip install google-generativeai customtkinter Pillow tkinterdnd2-Universal googletrans==3.1.0a0
25.05.17/独立Gemini UI
本程序提供一个独立于ComfyUI工作流的专用用户界面,用于利用Google的Gemini。
为何使用独立UI?
该工具专为解决在ComfyUI中执行图像分析时的常见问题而开发:WAN(或其他生成模型)的卸载。此卸载过程会导致您切换回图像生成时出现显著延迟。通过使用此独立UI进行Gemini图像分析,您可保持ComfyUI中的主要生成模型常驻加载,从而节省时间并提升工作流效率。
默认提示词(通过gemini_app_settings.json)
若将提供的gemini_app_settings.json文件置于应用程序同一目录下,它将自动加载默认提示词集(例如,配置为“v1.2a wan2.1 i2v”或您指定的默认值)。当然,您也可以在UI中修改或使用自己的提示词。
快速入门 - 安装
要运行此应用程序,您可能需要安装几个Python库。请打开命令提示符(CMD)或终端,输入以下命令:
pip install google-generativeai customtkinter Pillow tkinterdnd2-Universal
如何运行
确保您的系统已安装Python。
使用上述pip install命令安装所需库。
将prompts.json文件(如有默认提示词)置于Python脚本同一目录下。
运行脚本:如需显示控制台窗口,请运行:python gemini_ui.py
NSFW图像分析
如果您正在分析NSFW图像,请在“系统提示词”字段的最底部添加相关的内容描述。
[**用户输入**: (您的提示词)]
=====
25.05.14/v1.0b 用于i2v的Joy字幕
使用JoyCaption实现完整、无审查的图像分析和i2v提示词生成。其生成的自然运动行为具有独特性,在某些情况下可能无法达到Gemini 2.0 Flash的流畅度(此前已建立几乎无审查的版本)。
huggingface演示:https://huggingface.co/spaces/fancyfeast/joy-caption-beta-one
github:https://github.com/fpgaminer/joycaption
25.05.05/i2v v1.2a,start-end v1.1a,Framepack v1.0a
本版本已更新,以与近期修订的自定义节点对齐,并确保能分析NSFW图像或提示词。
+我修改了一些在Manager中找不到的自定义节点,您安装自定义节点时不再感到不适。
+需要最新版的ollamamini自定义节点。
25.04.18/start/end v1.0
解决了最终提示词过长的问题;改进了起始帧与结束帧之间过渡的连贯性与视觉衔接,并添加了翻译节点。
25.04.18/FramePack v1.0
创建一个非常简单的提示词。
https://github.com/lllyasviel/FramePack
25.04.14/i2v v1.1
修复了因过长且不必要的最终提示词引发的问题,并调整以避免连续API调用。
*25.04.15/v1.1a - 添加翻译节点
25.03.19/v1.0
修复了LLM提示词中存在单个错误符号的问题。此为小幅改动,但可能略微改善非英文文本输入时出现的问题。此外,流式选项的默认设置已由开启改为关闭。
25.03.25/start-end帧(beta)-> beta+(通过修改部分提示词改进结果)
kijai工作流
分析起始帧与结束帧图像,并最终生成适用于i2v起始-结束工作流的合适提示词。然而,根据图像或运动内容,结束帧可能无法正常工作。(若您能正确输入额外运动,可使用现有v1.0工作流强化中间运动。)

