📌 最適な設定ガイドライン

📝概要

このComfyUIワークフローは、WD14、JoyCaption、Ollamaをシームレスに統合し、画像から詳細で正確なキャプションを生成します。100%の精度を保証するものではありませんが、ほとんどのケースで十分な結果を導きます。一部の画像では、最適なキャプションを得るためにワークフローを2～3回実行する必要がある場合があります。

📦 必要なパッケージ

スムーズな機能を確保するには、以下のComfyUIカスタムノードをインストールしてください：

⚙️ 使用方法：主要ノードの説明

このワークフローは、キャプション生成とタグ処理を制御する3つの主要ノードを中心に構成されています。各ノードの使い方を以下に説明します。

1. JoyCaption 指示

目的：JoyCaptionノードを使用して、画像の初期キャプションを生成します。
使用方法：
- 画像入力をこのノードに供給します。
- ノードパラメータでスタイルや詳細レベルを調整し、キャプション出力をカスタマイズできます。
- 生成されたキャプションは、さらに洗練するための基盤となります。

2. Ollama 指示

目的：Ollamaの言語モデルを利用して、キャプションを洗練・強化します。
使用方法：
- JoyCaptionの出力テキストをこのノードの入力として使用します。
- Ollama指示を使用して、文脈を追加したり、キャプションを整理・拡張できます。
- プロンプトテンプレートやパラメータを調整し、希望するキャプションスタイルに合わせて最適化できます。

3. タグ削除

目的：生成されたキャプションから不要または関連のないタグを削除し、プロンプトの品質を向上させます。
使用方法：
- 削除したい単語やフレーズのタグリストを設定できます。
- 最終的なキャプションを簡潔かつ有用に保ち、後続タスク（例：テキストから画像を生成する処理）に適した形に整えます。

注意点：

このノードに与える指示によって、出力は大きく異なる可能性があります。ご使用の用途に最適な結果を得るため、さまざまなプロンプトやパラメータを試してみてください。
現在の指示は、SFW（仕事中の閲覧に適したコンテンツ）およびNSFW（仕事中の閲覧に不適なコンテンツ）の両方に対して最適化されています。

モデルタイプ	ワークフロー
ベースモデル	Other
公開日	8/11/2025

Captioning With Extra Steps - Workflow (ComfyUI)

詳細

ファイルをダウンロード

モデル説明

📌 最適な設定ガイドライン

このモデルで生成された画像