Caption Creator [v7.3]
세부 정보
파일 다운로드
모델 설명
캡션 생성기 v7.3 (MM744 제작)
캡션 생성기 v7.3으로 데이터셋 생성의 다음 세대를 경험하세요. 이번 버전은 완전히 재설계된 UI와 강력한 새로운 기능을 탑재했습니다. 이 빠르고 완전히 이식 가능한 GUI 도구는 뛰어난 이미지 캡션과 태그를前所未有的으로 쉽게 생성하도록 설계되었습니다. Pony, SDXL, Illustrious 같은 AI 모델을 위한 고품질 데이터셋 생성에 최적화된 최고의 조수입니다. LoRA 학습과 고급 이미지 프롬프팅 모두에 완벽하게 적합합니다.
이 애플리케이션은 로컬 머신에서 완전히 실행되므로 개인정보 보호와 검열 없는 출력을 보장합니다. 내장된 Python 환경과 정교하고 직관적인 인터페이스로 시작이 이전보다 훨씬 쉬워졌습니다.
스크린샷:


기능:
이중 생성 모드: 상세한 캡션 또는 간결한 콤마 구분 태그를 자유롭게 전환하여 생성합니다.
지능형 태그 포맷팅: AI 출력을 완벽한 한 줄 콤마 구분 리스트로 자동 정리하고, 메모 및 불필요한 포맷을 제거합니다.
강력한 일괄 처리: 한 번의 실행으로 이미지 폴더 전체를 처리하며, 명확한 갤러리 스타일 진행 상태 표시를 제공합니다.
이식 가능 및 자체 포함: 설치 불필요. 자체 내장된 Python을 포함한 단일 폴더에서 실행되며, 바로 작동합니다.
검열 없는 로컬 AI: 콘텐츠 필터 없이 로컬에서 실행되는 모델을 사용해 완전한 창의적 자유를 누립니다.
완전한 UI 개선: 전문적인 작업 흐름을 위한 세련되고 현대적이며 반응형 다크 테마 인터페이스를 제공합니다.
LM Studio 통합: 고급 사용자는 실행 중인 LM Studio 인스턴스에 직접 연결하여 호환 가능한 모든 모델을 사용할 수 있습니다.
이미지 직접 붙여넣기: 클립보드에서 이미지를 붙여넣기만 하면(Ctrl+V) 즉시 처리할 수 있습니다.
인터랙티브 모델 관리: 앱 내 직관적인 모달 인터페이스를 통해 모델을 다운로드, 삭제 및 관리할 수 있습니다.
내장 ZIP 아카이빙: 생성 작업(이미지 및 텍스트 파일)을 한 번의 클릭으로 단일 ZIP 아카이브로 저장합니다.
프롬프트 풍부화: 설정 파일을 편집하지 않고도 실시간으로 AI에 추가 컨텍스트나 지시를 제공하여 출력을 유도합니다.
직관적인 제어: 기본 입력을 맞춤형 슬라이더와 스위치로 교체하여 더 직관적이고 효율적인 사용자 경험을 제공합니다.
VRAM 최적화: 다양한 GPU VRAM 용량(5GB, 8GB, 10GB, 20GB)에 맞춰 설계된 모델을 선택할 수 있습니다.
저VRAM 모드: 메모리가 제한된 시스템에서 VRAM 사용량을 추가로 줄이기 위한 전용 체크박스를 제공합니다.
모델 유지 로딩: 작업 후 AI 모델을 VRAM에 유지하여 후속 생성 속도를 극적으로 향상시킵니다.
자동 종료: 긴 일괄 처리가 완료된 후 PC를 자동으로 종료합니다.
완전한 Kohya_SS 내보내기: 드래그 앤 드롭 준비된 학습 데이터셋을 위해 Kohya_SS 폴더 구조 내보내기를 활성화하고 구성할 수 있습니다.
유연한 포맷팅: 트리거 단어를 사용하고, 최대 단어 수를 정의하며, 캡션을 단일 문단으로 포맷팅할 수 있습니다.
간편한 접근: 생성된 텍스트를 클립보드로 즉시 복사하거나 UI에서 출력 폴더를 직접 열 수 있습니다.
사용 방법:
다운로드 및 압축 해제: 프로그램을 다운로드하고 .zip 아카이브를 폴더에 압축 해제합니다.
애플리케이션 실행: Caption Creator.exe를 더블클릭하여 프로그램을 시작합니다.
모델 관리:
"모델 / VRAM 구성" 버튼을 클릭하여 모델 선택 패널을 엽니다.
내장 모델 사용: 모델이 "사용 가능"로 표시되지 않은 경우, 옆의 다운로드 아이콘(📥)을 클릭하세요. 앱이 자동으로 다운로드 및 설치합니다.
LM Studio 사용: "사용자 정의(LM Studio)" 옵션을 선택하고 "연결"을 클릭하여 실행 중인 LM Studio 서버와 연결합니다.
목록에서 원하는 모델을 선택하여 활성화합니다.
이미지 로드:
단일 모드: 이미지를 드래그 앤 드롭, 클릭하여 탐색, 또는 클립보드에서 붙여넣기합니다.
일괄 모드: 여러 이미지를 드래그 앤 드롭하거나, 클릭하여 일괄 파일을 선택합니다.
구성 및 생성:
생성 유형을 선택합니다(캡션 또는 태그).
최대 단어 수, 트리거 단어 등을 조정하고, 저VRAM 모드 및 Kohya_SS 내보내기와 같은 옵션을 활성화합니다.
생성을 클릭합니다.
출력 확인: 상태 창에서 실시간 진행 상황을 확인하세요. 생성된 텍스트와 이미지는 오른쪽 패널에 표시되며, 자동으로 output 폴더에 실행별로 정리되어 저장됩니다.
출력 예시:
캡션 (단일 문단 형식 활성화):
이 이미지는 비디오 게임 "스트리트 파이터 II"의 여성 캐릭터를 디지털 일러스트로 표현한 것입니다. 그녀는 빨간 리본으로 묶인 두 개의 땋은 머리카락을 가지고 있으며, 피부는 밝고 푸른 눈으로 전방에 집중한 표정을 짓고 있습니다. 빨간 베레모 모자(정면 중앙에 흰색 단추)를 쓰고, 녹색 민소매 티셔츠를 입으며, 빨간 손가락 없는 장갑을 끼고 있습니다. 오른팔은 앞으로 뻗어 주먹을 쥐고 펀치를 준비하는 듯한 자세입니다. 왼팔은 몸 뒤쪽으로 약간 뒤쳐져 있지만, 덜 두드러지게 앞으로 뻗어 있습니다. 배경은 위쪽은 어두운 회색에서 아래쪽은 검정으로 그라데이션을 이루며, 캐릭터의 밝은 옷 색과 대비를 제공합니다. 캐릭터의 표정은 결의와 집중을 담고 있으며, 입을 약간 벌리고 작은 이빨이 보입니다. 팔과 어깨의 선명한 윤곽선을 통해 근육질의 체형이 드러납니다. 전체 일러스트 스타일은 "스트리트 파이터" 시리즈의 예술적 디자인에 부합하는 매우 세밀하고 역동적인 형태입니다. 이미지는 양쪽과 상하에 회색 테두리로 둘러싸여 직사각형 구성이 되며, 이 프레임 효과는 중심 캐릭터에 깊이와 초점을 더합니다. 전체 이미지는 힘과 전투 준비 상태를 강력하게 전달합니다.
태그:
디지털 아트, 여성 캐릭터, 근육질 체형, 녹색 민소매 티셔츠, 흰색 단추가 달린 빨간 베레모, 빨간 손가락 없는 장갑, 땋은 금발 머리, 집중된 표정, 오른팔 앞으로 뻗음, 이를 악물음, 어두운 파란색 그라데이션 배경, 화려한 색상, 애니메이션 스타일, 강렬한 포즈, 상체, 역동적인 조명, 고대비, Illustrious 품질, 격투 게임 캐릭터, 카밀라(스트리트 파이터), 진지한 태도, 자신감 있는 자세, 운동선수 같은 체형, 결의한 표정, 강렬한 윤곽선, 사실적인 음영, 생생한 디테일, 중간 근접 촬영, 액션 포즈, 캐릭터 디자인, 비디오 게임 미학, 강한 얼굴 특징, 역동적인 구성, 에너지 넘치는 포즈, 격렬한 태도, 표현력 있는 눈, 강력한 자세, 전투 준비 태세
태그:
#caption-creator #dataset #tagging #portable #uncensored #batch-processing #memory-optimized
공식 GitHub - https://github.com/Merserk/Caption-Creator
Patreon 지원 - https://www.patreon.com/MM744


