ComfyUI beginner friendly Florance 2 Batch Images to Caption Super Simple Workflow by SarcasticTOFU
세부 정보
파일 다운로드
모델 설명
JoyCaption이 내 Mac에서 이상한 방식으로 작동해서 정말 짜증났기 때문에, Florance 2를 사용하여 간단한 대안인 배치 이미지 캡셔닝 ComfyUI 워크플로우를 만들기로 결정했습니다. 이 워크플로우는 Linux 또는 Windows 기반의 저사양 NVIDIA 또는 AMD GPU(6/8GB VRAM)에서도 잘 작동합니다. 저는 이것이 어떤 플랫폼에서든 JoyCaption에 대한 매우 실용적인 대안이라고 생각합니다. 사용법은 매우 간단합니다:
#1. 원하는 Florance 2 모델을 로드하세요(Florance-2-Flux-Large 또는 Florance-2-SD3-Captioner 또는 기타 모델)
#2. 캡셔닝할 이미지가 저장된 폴더 경로를 복사하여 붙여넣거나 입력하세요.
#3. 캡셔닝된 출력물을 저장할 폴더 경로를 설정하세요.
#4. 캡션 설정을 구성하세요.
...그것뿐입니다! 이제 실행 버튼을 클릭하세요.
이 작업은 각 이미지에 해당하는 별도의 .txt 파일(Captioned_Image_01.jpg에는 Captioned_Image_01.txt, Captioned_Image_02.jpg에는 Captioned_Image_02.txt 등)로 캡션을 저장하며, 이후 캡션을 검토하고 정교하게 조정할 수 있습니다. Florance 2는 Flux 및 Stable Diffusion 3.5에 대해 매우 훌륭한 성능을 발휘합니다(이미지 내 텍스트 인식도 포함). 그러나 복잡한 텍스트나 일부 일러스트레이션에서는 약간의 문제가 있을 수 있으므로 캡션을 다시 확인하는 것이 좋습니다. 필요한 노드가 누락되었다면 ComfyUI Manager를 사용하여 설치하세요. 처음 실행할 때만 Florance 2 다운로더 및 로더를 사용하세요(기존 Florance 2 모델 로더에서 노드 연결을 이동). 그 외에는 일반 로더를 사용하세요. 첫 번째 실행 시 이 도구를 활성화하고(기존 로더는 비활성화해야 함), Florance 2 모델을 올바른 경로에 다운로드하고 설정합니다. 두 번째 실행부터는 일반 로더를 사용하면 됩니다. 다른 워크플로우(HiDream, WAN, QWEN Image, Flux 등)를 시도하고 싶다면, 이 아카이브에 포함된 텍스트 파일에 내가 CivitAI 프로필에 올린 다른 워크플로우에 필요한 HuggingFace 다운로드 링크가 더 많이 포함되어 있습니다.







