LoRA Dataset Caption Aid with Ollama Vision Uncensored

このワークフローは、キャラクターLoRA用のキャプションを作成する際の出発点を得るために使用されます。画像を入力すると、システムが画像を分析し、適切なキャプション作成に必要なすべての関連情報を含む、キャラクターLoRA向けに最適化された包括的な説明を提供します。

私は、検閲されておらず、キャラクターLoRA用の適切なキャプションを作成する方法について詳細なプロンプトを渡せる、ビジョン機能付きの優れたOllamaモデルを見つけました。このOllamaモデルのサイズは約7GBで、単独で実行すればほぼすべてのGPUに収まります。

さらに、極端なクローズアップなど、AIに最低限のコンテキストが与えられないと画像分析が誤るような特別な状況に対して、ユーザーがビジョンモデルにヒントを提供できる「ヒント」ボックスを追加しました。ほとんどの場合、このボックスは空のままにしてください。

また、最良のキャプション作成のためのヒントを含むいくつかのマーカードノートも追加しました。