Integrate GPT-4o into comfyui to achieve LLM visual functions!
세부 정보
파일 다운로드
모델 설명
GPT-4o가 출시되었고, 저는 이에 맞춰 저의 커뮤니티 오픈소스 프로젝트인 ComfyUI 에이전트에 GPT-4o 통합 기능을 추가하여 시각적 기능을 구현하게 되었습니다.
프로젝트 주소: heshengtao/comfyui_LLM_party: ComfyUI 개발을 위한 블록 기반 LLM 에이전트 노드 라이브러리 세트 (一组面向comfyui开发的积木化LLM智能体节点库)
저의 오픈소스 프로젝트에서는 다음 기능을 사용할 수 있습니다:
ComfyUI 인터페이스에서 마우스 오른쪽 버튼을 클릭하고 컨텍스트 메뉴에서
llm을 선택하면, 이 프로젝트의 노드를 찾을 수 있습니다. [노드 사용법](how_to_use_nodes.md)API 통합 또는 로컬 대형 모델 통합을 지원합니다. 도구 호출을 모듈화하여 구현합니다. base_url을 입력할 때는
/v1/로 끝나는 URL을 사용하세요. 모델 관리에는 [ollama](https://github.com/ollama/ollama)를 사용할 수 있습니다. 그런 다음 base_url에http://localhost:11434/v1/, api_key에ollama, model_name에 모델 이름(예: llama3)을 입력하세요. 503 오류가 발생하면 프록시 서버를 끄고 시도해 보세요.RAG 지원을 통한 로컬 지식베이스 통합.
코드 해석기 호출 기능.
온라인 검색 기능을 활성화하며, Google 검색 지원 포함.
ComfyUI 내에서 조건문을 구현하여 사용자 질문을 분류하고 맞춤형 응답을 제공.
대형 모델 간 루프 연결 지원. 두 개의 대형 모델이 토론을 할 수 있도록 합니다.
원하는 페르소나 마스크를 부착하고 프롬프트 템플릿을 사용자 정의 가능.
날씨 조회, 시간 조회, 지식베이스, 코드 실행, 웹 검색, 단일 페이지 검색 등 다양한 도구 호출 지원.
LLM을 도구 노드로 사용.
API + Streamlit을 사용하여 자체 웹 애플리케이션을 빠르게 개발 가능. 아래 이미지는 그림 생성 애플리케이션의 예시입니다.
대형 모델이 어떤 작업이든 수행할 수 있도록 하는 위험한 만능 해석기 노드를 추가했습니다.
LLM 노드의 출력 표시로, 마우스 오른쪽 버튼 메뉴의
function하위 메뉴에 있는show_text노드 사용을 권장합니다.

