Captioning With Extra Steps - Workflow (ComfyUI)

詳細

ファイルをダウンロード

モデル説明

📌 最適な設定ガイドライン

📝概要

このComfyUIワークフローは、WD14、JoyCaption、Ollamaをシームレスに統合し、画像から詳細で正確なキャプションを生成します。100%の精度を保証するものではありませんが、ほとんどのケースで十分な結果を導きます。一部の画像では、最適なキャプションを得るためにワークフローを2~3回実行する必要がある場合があります。

📦 必要なパッケージ

スムーズな機能を確保するには、以下のComfyUIカスタムノードをインストールしてください:

  1. ComfyUI-WD14-Tagger

  2. ComfyUI-Ollama

  3. ComfyUI-Prompt-Reader-Node

  4. ComfyUI-JoyCaption

  5. Python Interpreter Node

  6. ComfyUI-Various

  7. Dolphin3

  8. zipファイル内に追加で2つ

⚙️ 使用方法:主要ノードの説明

このワークフローは、キャプション生成とタグ処理を制御する3つの主要ノードを中心に構成されています。各ノードの使い方を以下に説明します。

1. JoyCaption 指示

  • 目的:JoyCaptionノードを使用して、画像の初期キャプションを生成します。

  • 使用方法

    • 画像入力をこのノードに供給します。

    • ノードパラメータでスタイルや詳細レベルを調整し、キャプション出力をカスタマイズできます。

    • 生成されたキャプションは、さらに洗練するための基盤となります。

2. Ollama 指示

  • 目的:Ollamaの言語モデルを利用して、キャプションを洗練・強化します。

  • 使用方法

    • JoyCaptionの出力テキストをこのノードの入力として使用します。

    • Ollama指示を使用して、文脈を追加したり、キャプションを整理・拡張できます。

    • プロンプトテンプレートやパラメータを調整し、希望するキャプションスタイルに合わせて最適化できます。

3. タグ削除

  • 目的:生成されたキャプションから不要または関連のないタグを削除し、プロンプトの品質を向上させます。

  • 使用方法

    • 削除したい単語やフレーズのタグリストを設定できます。

    • 最終的なキャプションを簡潔かつ有用に保ち、後続タスク(例:テキストから画像を生成する処理)に適した形に整えます。


注意点

  • このノードに与える指示によって、出力は大きく異なる可能性があります。ご使用の用途に最適な結果を得るため、さまざまなプロンプトやパラメータを試してみてください。

  • 現在の指示は、SFW(仕事中の閲覧に適したコンテンツ)およびNSFW(仕事中の閲覧に不適なコンテンツ)の両方に対して最適化されています。

このモデルで生成された画像

画像が見つかりません。