Advanced Flux Captioning with GPT4O
詳細
ファイルをダウンロード
モデル説明
こんにちは、
Flux用の画像バッチに対応するため、高度なキャプション生成ワークフローとシステム指示を作成しました。Fluxは2つのテキストエンコーダー、Clip L(77トークン)とT5(256トークン)を使用しているため、2つのキャプションストリームを実装しました。T5用にNLパス、Clip L用にコンマ区切りパスを用意しています。小さなデータセットでは、両方のストリームを使用することが多いです。これにより、自然言語またはコンマ区切りのシーケンスでプロンプトを入力できるようになります。GPT4Oコンポーネントを実行するには、OpenAI APIキーをルートフォルダーに追加する必要があります。このワークフローはまもなく再度更新する予定です。
それまでお楽しみください。
