Comic Speech Bubble Detection - ADetailer - (comic_speechbubble_m_yolov8)
詳細
ファイルをダウンロード
モデル説明
漫画のセリフバブルと音効を画像から検出するYOLOv8検出モデルです。
このモデルはADetailerとして使用できます(Automatic1111 / Stable Diffusion用)、または他のinferenceスクリプトを使用して、ウォーターマークの検出バウンディングボックスを返すこともできます。
モデルの使用方法に関する簡単なチュートリアルは、以下のGitHubで確認できます:https://github.com/MNeMoNiCuZ/yolov8-scripts またはこのCivitAI記事。
このモデルは研究目的のみに使用することを意図しています。 モデルは以下のデータセットに基づいて完全にトレーニングされています:yolomanga/speechballoon_comic しかし、このデータセットはすべてマーベルの漫画パネルから作成されているため、元の作者はこれらの画像をCC4でライセンスできないと考えられます。したがって、このモデルを商業的に使用することはできないと考えられます。
comic_speechbubble_m_yolov8_v1: 
comic_speechbubble_s_yolov8_v1

注意:
大きなプレビュー画像は正しいモデルのものではない可能性があります。
A1111のスクリーンショットは正しくバージョンに対応しています。
中規模モデルは一般的にやや優れた性能を示します。
