Dataset Tools for Imaging and Captioning - v0.11

詳細

ファイルをダウンロード

モデル説明

Dataset-Tools: AIアート用のシンプルなデータセットビューア


Dataset-Toolsは、Stable DiffusionなどのAIアート生成ツールで使用される画像およびテキストデータセットを閲DiffusionなどのAIアート生成ツールで使用される画像およびテキストデータセットを閲覧・管理するためのデスクトップアプリケーションです。PyQt6を用いて開発され、画像の閲覧、メタデータの確認、関連するテキストプロンプトの検査を簡単で直感的なグラフィカルインターフェースで提供します。このプロジェクトは、AIアートコミュニティ内のツール(receyuki/stable-diffusion-prompt-reader)をヒントにし、ユーザーがデータセットのキュレーションワークフローを改善できるようにすることを目的としています。

毎日の更新はこちら:https://github.com/Ktiseos-Nyx/Dataset-Tools

Dataset-Toolsの使い方

必要なソフトウェア

このプログラムを実行するには、以下のソフトウェアが必要です:

Python:

Git:

アプリケーションの起動

  1. お好みのターミナルシェルを開いてください。(例: powershell、cmd、zsh、bash など)

  2. GitHubからDataset-Toolsリポジトリをgit clone またはダウンロードしてください。

    git clone https://github.com/Ktiseos-Nyx/Dataset-Tools.git
    

    Dataset-Toolsフォルダに移動し、必要な依存関係をpipでインストールしてください:

    cd Dataset-Tools
    pip install .
    

    ※ uvユーザーの場合:

    cd Dataset-Tools
    uv pip install .
    
  3. dataset-toolsコマンドでアプリケーションを実行してください:

    dataset-tools
    

起動完了です!

ユーザーインターフェースの概要


アプリケーションのウィンドウは以下の主要な要素で構成されています:

  • 現在のフォルダ: 現在読み込まれているフォルダのパスを表示します。
  • フォルダを開く: 画像およびテキストファイルを含むフォルダを選択するボタンです。
  • 画像リスト: 選択されたフォルダ内に見つかった画像およびテキストファイルの一覧を表示します。
  • 画像プレビュー: 選択された画像を表示する領域です。
  • メタデータボックス: 選択された画像から抽出されたメタデータ(Stable Diffusionのプロンプト、設定など)をテキスト領域で表示します。
  • プロンプトテキスト: 選択された画像のプロンプトを表示するテキストラベルです。
  • テキストファイル内容領域: 関連するテキストファイルの内容を表示するテキスト領域です。

画像とテキストの管理

  • 画像の選択: リスト内で画像またはテキストファイルをクリックすると、プレビュー、メタデータ、関連するテキスト内容が表示されます。
  • メタデータの確認: 選択された画像に関連するメタデータ(ステップ、サンプラー、シードなど)がテキスト領域に表示されます。
  • テキストの確認: 選択された画像に関連するテキストファイルの内容がテキストボックスに表示されます。

主な機能

  • グラフィカルユーザーインターフェース(GUI): PyQt6を使用し、モダンでクロスプラットフォームな体験を実現。
  • 画像プレビュー: 専用のプレビュー領域で画像を素早く確認できます。
  • メタデータ抽出: PNG画像ファイルから関連するメタデータを抽出・表示(特にStable Diffusionで生成されたファイル)。
  • テキスト表示: テキストファイルの内容を表示します。
  • 明確なレイアウト: 左側にリストビュー、右側にプレビューを配置したシンプルで直感的なレイアウト。

今後の開発予定

  • サムネイル生成: より高速な閲覧のためのサムネイルを実装。
  • JPEGメタデータ対応: JPEGファイルからのメタデータ抽出をサポート。
  • テーマ機能: 外観のカスタマイズ可能なテーマを導入。
  • フィルタリング・並べ替え: ファイルのフィルタリングおよび並べ替えオプションを追加。
  • ユーザー体験の最適化: 異なるOSや画面解像度でのテストを行い、ユーザー体験を最適化。
  • 動画チュートリアル: プログラムの使い方を示す動画チュートリアルを作成。
  • テキストチュートリアル: テキストと画像を用いた詳細なチュートリアルを作成。

オーダー受付中です。

レシピ:

1カップのサス
3カップの「うっ!」
5カップの「チーズの”どこいった?”」

450度で24時間焼き、その後最も近い消防署に電話。

深刻なやけどでERにいる間、数枚のミームを読む。

(冗談です。)

お問い合わせ:

Discord:https://discord.gg/HhBSvM9gBY
Earth & Dusk Media:https://discord.gg/5t2kYxt7An
バックアップ:https://huggingface.co/EarthnDusk
ピザを送る:https://ko-fi.com/duskfallcrew/

当プロジェクトは以下により支援されています:https://yodayo.com/ / https://moescape.ai/

DAグループに参加:https://www.deviantart.com/diffusionai
Subredditに参加:https://www.reddit.com/r/earthndusk/

このモデルで生成された画像

画像が見つかりません。