Integrate GPT-4o into comfyui to achieve LLM visual functions!
詳細
ファイルをダウンロード
モデル説明
GPT-4oがリリースされ、私は私のComfyUIエージェントのオープンソースプロジェクトにGPT-4oの統合を有効化し、ビジュアル機能を実現することでこの excitement に参加します。
プロジェクトのアドレスは:heshengtao/comfyui_LLM_party: ComfyUI開発用に設計されたブロックベースのLLMエージェントノードライブラリのセット(一组面向comfyui开发的积木化LLM智能体节点库)
私のオープンソースプロジェクトでは、以下の機能を利用できます:
- ComfyUIインターフェースで右クリックし、コンテキストメニューから - llmを選択すると、このプロジェクトのノードが表示されます。[ノードの使い方](how_to_use_nodes.md)
- API統合またはローカル大規模モデル統合をサポート。ツール呼び出しのモジュール化実装。base_urlを入力する際は、 - /v1/で終わるURLを使用してください。モデルの管理には[ollama](https://github.com/ollama/ollama)を使用できます。その後、base_urlに- http://localhost:11434/v1/、api_keyに- ollama、model_nameにモデル名(例:llama3)を入力してください。503エラーが発生した場合は、プロキシサーバーを無効にしてみてください。
- RAG対応のローカル知識ベース統合。 
- コードインタープリターの呼び出し機能。 
- オンラインクエリを可能にし、Google検索のサポートを含みます。 
- ComfyUI内で条件文を実装し、ユーザーのクエリを分類してターゲット応答を提供できます。 
- 大規模モデルのループリンクをサポートし、2つの大規模モデルが議論を交わすことができます。 
- 任意のパーソナマスクをアタッチし、プロンプトテンプレートをカスタマイズできます。 
- 天気検索、時刻検索、知識ベース、コード実行、ウェブ検索、シングルページ検索など、さまざまなツールの呼び出しをサポート。 
- LLMをツールノードとして使用。 
- API + Streamlitを用いて独自のWebアプリケーションを迅速に開発できます。以下の画像は、描画アプリケーションの例です。 
- 大規模モデルが任意のタスクを実行できる危険な万能インタープリターノードを追加。 
- LLMノードの出力表示には、右クリックメニューの - functionサブメニュー内の- show_textノードの使用を推奨します。

