Dataset Tools for Imaging and Captioning - v0.5

세부 정보

파일 다운로드

모델 설명

Dataset-Tools: AI 아트를 위한 간단한 데이터셋 뷰어


Dataset-Tools는 Stable Diffusion과 같은 AI 아트 생성 도구에서 사용되는 이미지 및 텍스트 데이터셋을 탐색하고 관리하는 데 도움이 되는 데스크톱 애플리케이션입니다. PyQt6를 사용하여 개발된 이 도구는 이미지 탐색, 메타데이터 확인 및 관련 텍스트 프롬프트 검토를 위한 단순하고 직관적인 그래픽 인터페이스를 제공합니다. 이 프로젝트는 AI 아트 커뮤니티 내의 도구(receyuki/stable-diffusion-prompt-reader)에서 영감을 받아, 사용자들이 데이터셋 정리 워크플로우를 향상시키는 데 기여하도록 설계되었습니다.

매일 업데이트 확인하기: https://github.com/Ktiseos-Nyx/Dataset-Tools

Dataset-Tools 사용법

요구 사항

프로그램을 실행하려면 다음 소프트웨어가 필요합니다:

Python:

Git:

애플리케이션 실행

  1. 원하는 터미널 쉘을 열어주세요. (예: powershell, cmd, zsh, bash 등)

  2. GitHub에서 Dataset-Tools 저장소를 git clone하거나 다운로드하세요.

    git clone https://github.com/Ktiseos-Nyx/Dataset-Tools.git
    

    Dataset-Tools 폴더로 이동한 후 필요한 종속성을 pip로 설치하세요:

    cd Dataset-Tools
    pip install .
    

    참고: uv 사용자

    cd Dataset-Tools
    uv pip install .
    
  3. dataset-tools 명령으로 애플리케이션을 실행하세요:

    dataset-tools
    

이제 사용을 시작할 수 있습니다!

사용자 인터페이스 개요


애플리케이션 윈도우는 다음 주요 구성 요소로 이루어져 있습니다:

  • 현재 폴더: 현재 로드된 폴더의 경로를 표시합니다.

  • 폴더 열기: 이미지 및 텍스트 파일이 포함된 폴더를 선택할 수 있는 버튼입니다.

  • 이미지 목록: 선택한 폴더 내에서 발견된 이미지 및 텍스트 파일 목록을 표시합니다.

  • 이미지 미리보기: 선택된 이미지를 표시하는 영역입니다.

  • 메타데이터 박스: 선택된 이미지에서 추출된 메타데이터(Stable Diffusion 프롬프트, 설정 등 포함)를 표시하는 텍스트 영역입니다.

  • 프롬프트 텍스트: 선택된 이미지의 프롬프트를 표시하는 텍스트 라벨입니다.

  • 텍스트 파일 콘텐츠 영역: 관련 텍스트 파일의 콘텐츠를 표시하는 텍스트 영역입니다.

이미지 및 텍스트 관리

  • 이미지 선택: 목록에서 이미지 또는 텍스트 파일을 클릭하면 미리보기, 메타데이터 및 관련 텍스트 콘텐츠가 표시됩니다.

  • 메타데이터 보기: 선택된 이미지와 관련된 메타데이터(단계, 샘플러, 시드 등)가 텍스트 영역에 표시됩니다.

  • 텍스트 보기: 선택된 이미지와 연결된 텍스트 파일의 콘텐츠가 텍스트 상자에 표시됩니다.

주요 기능

  • 그래픽 사용자 인터페이스(GUI): 현대적이고 크로스 플랫폼 경험을 제공하기 위해 PyQt6로 구축되었습니다.

  • 이미지 미리보기: 전용 미리보기 영역에서 이미지를 빠르게 확인할 수 있습니다.

  • 메타데이터 추출: 특히 Stable Diffusion에서 생성된 PNG 이미지 파일에서 관련 메타데이터를 추출하고 표시합니다.

  • 텍스트 보기: 텍스트 파일의 콘텐츠를 표시합니다.

  • 명확한 레이아웃: 왼쪽에는 목록 보기, 오른쪽에는 미리보기가 배치된 단순하고 직관적인 레이아웃입니다.

향후 개발 계획

  • 썸네일 생성: 빠른 탐색을 위한 썸네일 기능 구현.

  • JPEG 메타데이터 지원: JPEG 파일에서 메타데이터를 추출할 수 있도록 지원 추가.

  • 테마: 외관을 사용자 정의할 수 있는 테마 도입.

  • 필터링/정렬: 파일을 필터링하고 정렬할 수 있는 옵션 제공.

  • 사용자 경험 개선: 다양한 운영체제 및 화면 해상도에서 테스트하여 사용자 경험을 최적화.

  • 동영상 튜토리얼: 사용자가 프로그램을 사용하는 방법을 보여주는 동영상 튜토리얼 제작.

  • 텍스트 튜토리얼: 텍스트 및 이미지를 활용해 프로그램 사용법을 자세히 안내하는 튜토리얼 제작.

커미션 문의 가능합니다.

레시피:

1 컵 사스

3 컵 움직이지 말아요.

5 컵 치토스는 어디에 있죠?

450도에서 24시간 구운 후 가장 가까운 소방서에 전화하세요.

심각한 화상으로 응급실에 간 동안 몇 개의 멤을 읽으세요.

(농담입니다.)

문의하기:

디스코드: https://discord.gg/HhBSvM9gBY

Earth & Dusk Media: https://discord.gg/5t2kYxt7An

백업: https://huggingface.co/EarthnDusk

피자를 보내주세요: https://ko-fi.com/duskfallcrew/

우리는 다음 기관에 의해 자랑스럽게 지원받습니다: https://yodayo.com/ / https://moescape.ai/

DA 그룹 가입: https://www.deviantart.com/diffusionai

서브레딧 가입: https://www.reddit.com/r/earthndusk/

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.