Comic Speech Bubble Detection - ADetailer - (comic_speechbubble_m_yolov8)
세부 정보
파일 다운로드
모델 설명
이미지에서 만화책 대사 풍선과 음향 효과를 감지하는 YOLOv8 감지 모델입니다.
이 모델은 ADetailer 모델로 사용할 수 있습니다(Automatic1111 / Stable Diffusion용) 또는 다른 추론 스크립트를 사용하여 워터마크의 감지 바운딩 박스를 반환할 수 있습니다.
이 모델 사용 방법에 대한 간단한 튜토리얼은 다음 GitHub 링크에서 확인할 수 있습니다: https://github.com/MNeMoNiCuZ/yolov8-scripts 또는 이 CivitAI 기사.
이 모델은 연구 목적으로만 사용됩니다. 이 모델은 완전히 다음 데이터셋에서 학습되었습니다: yolomanga/speechballoon_comic. 그러나 이 데이터셋은 완전히 마블 만화 판화에서 생성되었기 때문에, 원 저작자가 해당 이미지를 CC4 라이선스로 제공할 수 없다고 생각합니다. 따라서 이 모델을 상업적으로 사용할 수 없다고 생각합니다.
comic_speechbubble_m_yolov8_v1: 
comic_speechbubble_s_yolov8_v1

참고:
큰 미리보기 이미지는 올바른 모델에서 가져온 것이 아닐 수 있습니다.
A1111 스크린샷은 올바른 버전에서 가져온 것입니다.
중간 모델이 일반적으로 약간 더 우수한 성능을 보입니다.


