Comic Speech Bubble Detection - ADetailer - (comic_speechbubble_m_yolov8)

漫画のセリフバブルと音効を画像から検出するYOLOv8検出モデルです。

このモデルはADetailerとして使用できます（Automatic1111 / Stable Diffusion用）、または他のinferenceスクリプトを使用して、ウォーターマークの検出バウンディングボックスを返すこともできます。

モデルの使用方法に関する簡単なチュートリアルは、以下のGitHubで確認できます：https://github.com/MNeMoNiCuZ/yolov8-scripts またはこのCivitAI記事。

このモデルは研究目的のみに使用することを意図しています。 モデルは以下のデータセットに基づいて完全にトレーニングされています：yolomanga/speechballoon_comic しかし、このデータセットはすべてマーベルの漫画パネルから作成されているため、元の作者はこれらの画像をCC4でライセンスできないと考えられます。したがって、このモデルを商業的に使用することはできないと考えられます。

comic_speechbubble_m_yolov8_v1:

comic_speechbubble_s_yolov8_v1

注意：

大きなプレビュー画像は正しいモデルのものではない可能性があります。

A1111のスクリーンショットは正しくバージョンに対応しています。

中規模モデルは一般的にやや優れた性能を示します。

モデルタイプ	検出
ベースモデル	SD 1.5
公開日	2/19/2024

Comic Speech Bubble Detection - ADetailer - (comic_speechbubble_m_yolov8)

詳細

ファイルをダウンロード

モデル説明

このモデルで生成された画像