Comic Speech Bubble Detection - ADetailer - (comic_speechbubble_m_yolov8)

세부 정보

파일 다운로드

모델 설명

이미지에서 만화책 대사 풍선과 음향 효과를 감지하는 YOLOv8 감지 모델입니다.

이 모델은 ADetailer 모델로 사용할 수 있습니다(Automatic1111 / Stable Diffusion용) 또는 다른 추론 스크립트를 사용하여 워터마크의 감지 바운딩 박스를 반환할 수 있습니다.

이 모델 사용 방법에 대한 간단한 튜토리얼은 다음 GitHub 링크에서 확인할 수 있습니다: https://github.com/MNeMoNiCuZ/yolov8-scripts 또는 이 CivitAI 기사.


이 모델은 연구 목적으로만 사용됩니다. 이 모델은 완전히 다음 데이터셋에서 학습되었습니다: yolomanga/speechballoon_comic. 그러나 이 데이터셋은 완전히 마블 만화 판화에서 생성되었기 때문에, 원 저작자가 해당 이미지를 CC4 라이선스로 제공할 수 없다고 생각합니다. 따라서 이 모델을 상업적으로 사용할 수 없다고 생각합니다.


comic_speechbubble_m_yolov8_v1: image/jpeg

comic_speechbubble_s_yolov8_v1

참고:

큰 미리보기 이미지는 올바른 모델에서 가져온 것이 아닐 수 있습니다.

A1111 스크린샷은 올바른 버전에서 가져온 것입니다.

중간 모델이 일반적으로 약간 더 우수한 성능을 보입니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.