Auto Tagger
세부 정보
파일 다운로드
모델 설명
**사용 전에 Python을 설치하세요!!**
이 완전 자동 레이블링 도구는 오늘날 가장 강력한 대형 언어 모델(LLMs)을 이용해 학습 데이터셋에 자동으로 레이블을 생성합니다. 테스트 결과, Gemini 2.0 Flash를 사용하여 생성된 레이블은 인간의 수동 태깅과 유사한 정확도를 달성합니다.
1. **Python이 설치되어 있는지 확인하세요.** 이 레이블링 도구는 Google Gemini API용과 OpenAI API용 두 가지 버전을 제공합니다. Gemini API 버전을 사용하면 Google의 모든 모델을 활용할 수 있습니다. Google 계정이 있다면, Gemini AI 스타디오에서 무료 API 키를 얻을 수 있습니다—구체적인 방법은 온라인 튜토리얼을 확인하세요! 현재 Google은 계정당 무료 할당량을 제공하며, 비용을 지불하지 않더라도 하루 최대 1500회까지 Gemini 2.0 Flash를 사용할 수 있어 이미지 레이블링에 충분합니다! (*참고: 일부 지역에서는 Gemini API를 사용하려면 VPN 또는 유사한 도구가 필요할 수 있습니다.*) OpenAI API 키(또는 OpenAI 호환의 타사 API 키)를 보유하고 있다면, OpenAI API 버전을 사용하세요.
2. **압축을 풀고 start_webui.bat를 클릭하세요.** 첫 실행 시 필요한 종속성을 자동으로 설치합니다. 최소 500MB의 여유 공간이 있는지 확인하세요. 종속성 설치가 완료되면 웹 UI가 자동으로 열립니다. (*프로그램을 실행할 때 VPN/프록시를 끄세요. 그렇지 않으면 웹 UI가 시작되지 않을 수 있습니다.*)
3. **이 도구는 자동 배치 이미지 레이블링과 수동 단일 이미지 레이블링을 모두 지원합니다.**
*자동 배치 이미지 레이블링*을 실행하려면, '이미지 폴더' 필드에 학습 세트 경로를 입력하세요(예: c:\my_training_set)然后 페이지에서 '배치 이미지 처리'를 클릭하여 시작하세요. 생성된 레이블은 해당 이미지와 동일한 이름을 가진 .txt 파일로 저장되며, 이 파일은 학습 세트 폴더 내에 저장됩니다. 프로세스를 중단하려면 옆에 있는 '정지' 버튼을 클릭하세요.
*자동 배치 이미지 레이블링*은 멀티스레딩을 지원하며, 한 배치당 최대 40장의 이미지를 처리할 수 있습니다. API의 RPM(분당 요청 수) 제한이 충분히 높다면, 1000장의 이미지 학습 세트는 단 25번의 배치 처리로 자동 레이블링이 가능하며, 몇 분 내에 완료될 수 있습니다. '최대 동시 이미지(배치 크기)' 필드에서 한 배치당 이미지 수를 설정할 수 있습니다. ('배치 간 간격(초)'은 배치 사이의 대기 시간이며, 기본값 5초은 일반적으로 적절합니다.) 이미지를 순차적으로 하나씩 처리하려면, '최대 동시 이미지(배치 크기)'를 1로, '배치 간 간격(초)'을 0으로 설정하세요.
4. ****이 도구에는 '컨텍스트 학습(In-Context Learning)' 모드도 포함되어 있습니다.****(‘incontext-learning’ 레이블이 붙은 페이지를 찾아보세요.) 이 기능을 사용하면 두 개의 참조 이미지와 그에 해당하는 레이블을 업로드할 수 있습니다. LLM은 이 예시들에서 레이블링 스타일을 학습한 후, 나머지 이미지에 적용합니다. LLM이 특정 요구사항(예: 자연어 태그 또는 Danbooru 스타일 태그 출력)에 따라 레이블을 생성하도록 하려면, '컨텍스트 학습' 페이지를 사용하는 것이 매우 권장됩니다.
5. **이 도구는 데이터셋 전처리 기능도 지원합니다.** 여기서 400,000~1,000,000 픽셀 사이의 목표 총 픽셀 수를 입력하세요(600,000 이상 권장). '실행'을 클릭하면, 도구는 학습 세트의 이미지들을 원래 가로세로 비율을 유지한 채 지정된 픽셀 수에 맞춰 자릅니다. 작은 이미지를 사용하면 레이블링 비용을 효과적으로 절감할 수 있습니다. (이 기능은 원본 데이터셋에 전혀 영향을 주지 않으므로 안심하고 사용하세요.)
