Danbooru character wildcards sorted by gender and popularity/post count

详情

模型描述

按发帖数和性别排序的 Danbooru 角色标签通配符

有人要求这个,而我刚好闲着无聊就做了。e621 的列表 soon,也许吧,谁知道呢。
你可以从这里下载的 ZIP 压缩包包含多个版本,其中三个主要版本为 女性男性未定

每个版本都包含仅含前 X 个标签的子版本,所有标签均按发帖数排序。例如,“前 100 名女性”文本文件即包含 Danbooru 上最受欢迎的前 100 个角色。

以 "full" 结尾的文件包含大约有 6 条及以上发帖记录的角色,而大部分发帖数极低的角色都归入了“未定”类别。我认为“full”版本实际上用处不大,但我还是加上了——如果你希望尽可能多地使用仍适用于——比如 NoobAI 模型的角色,请选择前 5k-30k 的文件(男性/未定:5-10k,女性:5-30k)。否则,我建议你根据自己的判断选择一个合适的阈值。

注意:关于过滤

我有相当把握认为,女性和男性文本文件中的误判很少,但仍存在一些遗漏或未正确归类的标签,这些缺失的标签会出现在 indeterminate.txt 中。
因此,这些文件必须经过测试。如果你发现某个角色标签应属于其他文件,请在此评论、在 Civitai 上私信我,或在 GitHub 上提交 issue。

已知问题:
- 本应隐含其他角色标签的标签未被过滤,因为它们在 Danbooru 上未标记为“隐含”(可能是因为发帖数低)
- 非人类生物(如宝可梦、柯比等)很可能被错误归入男性/女性类别,例如柯比被归入男性,而他实际上属于中性。这些将在后续版本中修正。由于中性角色标签不足,难以准确过滤。如果你发现误判,请告诉我。

GitHub 仓库 包含通配符归档 + 一个包含所有标签及其发帖数的 CSV 文件,便于后续处理,以及 e621 和 Danbooru 标签自动补全的 CSV 文件。
此外,GitHub 仓库 包含用于生成标签自动补全 CSV 的脚本(请查看 wildcard 分支的通配符生成源代码——我不推荐使用,因为代码尚未完善,且我认为类似的工作早已有人完成,但我没有更多相关信息)。

我未来计划扩展此项目,加入在帖子中出现频率最高的标签通配符,但暂无具体时间表。

此模型生成的图像

未找到图像。