Integrate GPT-4o into comfyui to achieve LLM visual functions!
详情
下载文件
模型描述
GPT-4o 已发布,我通过将我的 ComfyUI 开源项目扩展以支持 GPT-4o 集成,实现视觉功能,加入这场热潮。
项目地址:heshengtao/comfyui_LLM_party: 一组面向 ComfyUI 开发的积木化 LLM 智能体节点库
在我的开源项目中,您可以使用以下功能:
您可以在 ComfyUI 界面中右键单击,从上下文菜单中选择
llm,即可找到本项目对应的节点。如何使用节点支持 API 集成或本地大模型集成,工具调用采用模块化实现。输入 base_url 时,请使用以
/v1/结尾的 URL。您可以使用 ollama 来管理您的模型。然后将 base_url 设为http://localhost:11434/v1/,api_key 设为ollama,model_name 设为您的模型名称,例如:llama3。如果调用出现 503 错误,可尝试关闭代理服务器。支持本地知识库集成,并具备 RAG 功能。
能够调用代码解释器。
支持在线查询,包括 Google 搜索功能。
在 ComfyUI 中实现条件判断,以分类用户查询并提供针对性响应。
支持大模型的循环链接,允许两个大模型进行辩论。
可附加任意角色面具,自定义提示模板。
支持多种工具调用,包括天气查询、时间查询、知识库、代码执行、网页搜索和单页搜索。
将 LLM 作为工具节点使用。
使用 API + Streamlit 快速开发您自己的网页应用。下图是一个绘图应用示例。
新增一个危险的全能解释器节点,允许大模型执行任意任务。
建议在右键菜单的
function子菜单中使用show_text节点作为 LLM 节点的输出显示。

