Comic Speech Bubble Detection - ADetailer - (comic_speechbubble_m_yolov8)

详情

模型描述

一个用于检测图像中漫画对话框和音效的YOLOv8检测模型。

该模型可作为ADetailer模型使用(适用于Automatic1111 / Stable Diffusion),或使用其他inference脚本返回水印的检测边界框。

有关如何使用该模型的小型教程,请参见此Github:https://github.com/MNeMoNiCuZ/yolov8-scripts 或此CivitAI文章


本模型仅用于研究目的。 该模型完全在以下数据集上训练:yolomanga/speechballoon_comic。然而,由于该数据集完全由漫威漫画片段组成,我认为原始作者无法将这些图像许可为CC4。我也认为此模型不能用于商业用途。


comic_speechbubble_m_yolov8_v1: image/jpeg

comic_speechbubble_s_yolov8_v1

注意:

大型预览图像可能并非来自正确的模型。

A1111的截图则来自正确版本。

中型模型通常表现略优。

此模型生成的图像

未找到图像。