Booru Madness

详情

下载文件

模型描述

使用方法:
这是 diffusers 版本。请将 diffusion_pytorch_model.safetensors 放入你的 /path/to/pixart/diffusers/transformers 文件夹中。

模型在超过 8 万张完全标记的 1boy/1girl 图像(随机收集)以及部分 WikiArt 图像上训练而成。其中包含一些兽人、一些怪物女孩,也包含一些常规动漫风格,具体占比多少?我不清楚,因为我没统计过,完全是随机的。

模型基本能理解大量 booru 标签,且大多未经过滤。它属于一个训练不足的概念验证模型,展示了拥有 4090 显卡和大约一周时间的人能实现什么成果。一些特点:高评分图像被添加了 "best_quality" 标签,中等高评分图像则有 "good_quality" 标签。所有 WikiArt 图像均带有 "fine_art" 标签,以及风格标签(例如 "style_impressionism"),并附有艺术家名称标签 "artist_wikiartname"。

模型能理解 booru 标签,也能理解英文句子——尽管它并未在句子上进行训练,仅使用了生成的 wdv3 标签或 booru 网站上的原始标签。

模型使用 1024px 分辨率训练,并采用推荐的多尺度分辨率设置,主要使用 CAME,辅以少量 Sophia,但 Sophia 表现不稳定且不可靠。

许可证遵循 Pixart 所要求的条款。

此模型生成的图像

未找到图像。