LoRA Dataset Caption Aid with Ollama Vision Uncensored

세부 정보

파일 다운로드

모델 설명

이 워크플로우는 캐릭터 LoRA를 위한 캡션을 작성할 때 시작점을 얻기 위해 사용됩니다. 이미지를 입력하면, 이 워크플로우는 이미지를 분석하여 캐릭터 LoRA에 적합한 포괄적인 설명을 제공하며, 올바른 캡션 작성에 필요한 모든 관련 세부 정보를 포함합니다.

저는 시각 기능을 갖춘 검열되지 않은 우수한 Ollama 모델을 발견했고, 이 모델에 캐릭터 LoRA를 위한 적절한 캡션을 만드는 방법에 대한 상세한 프롬프트를 입력했습니다. Ollama 모델의 크기는 약 7GB이며, 단독으로 실행할 경우 거의 모든 GPU에 적합합니다.

추가로, 극단적인 클로업과 같은 특별한 상황에서 AI가 최소한의 맥락을 제공받지 않으면 이미지 분석이 잘못될 수 있으므로, 사용자가 시각 모델에 힌트를 제공할 수 있는 "힌트" 박스를 추가했습니다. 대부분의 경우 이 박스는 비워두세요.

또한 최고의 캡션 작성에 대한 팁을 담은 몇 가지 마크다운 노트도 추가했습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.