ADetailer Head Accessory Segmentation / 帽子・王冠の検知

详情

模型描述

动漫配饰检测模型

精准检测帽子、发饰与王冠!

本模型专为 ADetailer(扩展插件) 设计,已在816张多样化的动漫图像上进行训练。


为什么选择本模型?

帽子与发饰对动漫角色而言,如同第二张面孔。然而,当这些细节在图像生成过程中尺寸较小时,往往容易模糊或变形。为解决这一难题,我们开发了本检测模型!

该模型采用基于分割的方法,避免了边界框(bbox)方法的缺陷,例如误将角色面部纳入检测范围。例如,宽檐帽(如草帽)能够被精准识别,而面部则完全不受影响。


高级功能

对于经验丰富的 ADetailer 用户,通过调整提示词并提高去噪强度,可显著修改配饰,甚至将其完全转变为全新设计。但这些设置较为复杂,建议仅在熟悉 ADetailer 的情况下进行尝试。


可检测内容

  • 帽子
  • 发带
  • 发饰
  • 王冠
  • 风帽
  • 头带
  • 头盔
  • 毛皮配饰
  • 冠冕
  • 丝带

可能无法检测的内容

  • 从角色头部移除的帽子或头盔
  • 动物耳朵
  • 恶魔角
  • 风帽延伸至肩部以下的部分,例如长面纱

注:本模型在写实画风中的检测准确度尚未验证


问答

Q:我应该将此文件放在哪里?

WebUI 用户:
AUTOMATIC1111_webui/stable-diffusion-webui/models/adetailer/

FORGE 用户:
stable-diffusion-webui-forge/models/adetailer/

一般而言,请将文件置于 models/adetailer 文件夹中。


Q:如果出现误检怎么办?

本模型经过多种配饰训练,有时可能将“结扣”或“丝带”误识别为装饰物。若发生此类情况,可提高 [检测模型置信度阈值] 以减少误检。


Q:即使使用 ADetailer,结果仍显得杂乱。

A: 若模型未能准确学习特定细节,即使放大也无法清晰生成。为改善此问题,建议在创建 LoRA 时提高 dim 值,或在训练数据集中加入头饰的特写图像,以帮助模型更精确地学习这些细节。


本指南旨在帮助您充分发挥“动漫配饰检测模型”的潜力,让您的创作之旅更加顺畅愉快!


如您能帮助我购置一台用于机器学习的电脑,将不胜感激。

https://ko-fi.com/99coins

https://www.patreon.com/c/user?u=44405057


动漫帽子、发饰、王冠检测

本模型专为 ADetailer(扩展插件)设计,已在816张多样动漫图像上训练完成。

发饰与帽子对动漫角色而言,无异于第二张面孔。
然而,当这些细节尺寸较小时,在图像生成过程中极易模糊或溶解。

为此,我们开发了本模型以解决这一难题。

本模型采用分割式方法,避免了边界框(bbox)方法的缺陷——即使检测宽檐草帽等大型帽子,也不会误包含角色面部。

此外,通过提高去噪强度并调整 ADetailer 的提示词,您甚至可将原始配饰彻底改变为全新设计。但此操作设置较为复杂,建议仅熟悉 ADetailer 的用户尝试。


可检测对象

・帽子
・发带
・发饰
・王冠
・风帽
・头箍
・头盔
・毛皮配饰
・冠冕
・丝带

可能无法检测的对象

・脱离头部的帽子或头盔
・动物耳朵
・恶魔角
・延伸至肩部以下的风帽部分,如长面纱

(※写实风格图像中的检测效果尚未验证)


问答

Q:此文件应放置于何处?

A:

WebUI 用户:
AUTOMATIC1111_webui/stable-diffusion-webui/models/adetailer/

FORGE 用户:
stable-diffusion-webui-forge/models/adetailer/

一般而言,请将文件置于 models/adetailer 文件夹中。


Q:出现错误检测时该如何处理?

A: 由于本模型学习了多种配饰,偶尔会对“结扣”或“丝带”产生误识别。若对此感到困扰,请提高 [检测模型置信度阈值]


Q:即使使用 ADetailer,结果仍显得混乱

A: 模型未准确学习的细节,即便放大也无法清晰绘制。建议在创建 LoRA 时提高 dim 值,或在训练数据中加入头饰特写图像,以帮助模型更精确地学习细节。


明年也请多多指教!

此模型生成的图像

未找到图像。