Animagine XL V3.1

详情

模型描述

Animagine XL 3.1 是 Animagine XL V3 系列的更新版本,对前一版本 Animagine XL 3.0 进行了增强。这个开源的动漫主题文本到图像模型经过改进,能够生成更高品质的动漫风格图像。它包含了更多来自知名动漫系列的角色、优化的数据集,以及用于提升图像生成效果的新美学标签。基于 Stable Diffusion XL 构建,Animagine XL 3.1 致力于为动漫爱好者、艺术家和内容创作者提供准确且细致的动漫角色表现,成为宝贵的资源。

模型详情

使用指南

标签顺序

为获得最佳效果,建议遵循以下结构化提示模板,因为我们的模型正是按此方式训练的:

1girl/1boy, 角色名称, 来自哪部作品, 其余内容顺序任意。

特殊标签

Animagine XL 3.1 使用特殊标签来引导生成结果在质量、评级、创作年代和美学风格上的表现。虽然模型在不使用这些标签的情况下也能生成图像,但使用它们有助于获得更佳效果。

质量修饰符

质量标签现在综合考虑评分和后续评级,以确保质量分布的均衡性。我们对标签进行了优化以提高清晰度,例如将“high quality”改为“great quality”。


质量修饰符	评分标准
masterpiece	        > 95%
best quality	        > 85% 且 ≤ 95%
great quality	        > 75% 且 ≤ 85%
good quality	        > 50% 且 ≤ 75%
normal quality	        > 25% 且 ≤ 50%
low quality	        > 10% 且 ≤ 25%
worst quality	        ≤ 10%

评级修饰符

我们还简化了评级标签,以提升简洁性和清晰度,旨在建立可跨不同模型应用的通用规则。例如,“rating: general”现在简化为“general”,“rating: sensitive”简化为“sensitive”。


评级修饰符	    评级标准
safe	            通用
sensitive	    敏感
nsfw	            有疑问
explicit, nsfw	    露骨

年代修饰符

我们重新定义了年代范围,以更精确地引导结果趋向特定的现代或复古动漫艺术风格。此次更新简化了范围,聚焦于与当前及过往时代的相关性。


年代标签	年代范围
newest	        2021 至 2024
recent	        2018 至 2020
mid	        2015 至 2017
early	        2011 至 2014
oldest	        2005 至 2010

美学标签

我们通过引入美学标签增强了标签系统,以根据视觉吸引力细化内容分类。这些标签源自一个专门针对动漫数据训练的 ViT(视觉变换器)图像分类模型的评估结果。为此,我们使用了模型 shadowlilac/aesthetic-shadow-v2,该模型在训练前评估内容的美学价值,确保每份内容不仅相关准确,而且视觉上具有吸引力。


美学标签	       评分范围
very aesthetic	       > 0.71
aesthetic	       > 0.45 且 < 0.71
displeasing	       > 0.27 且 < 0.45
very displeasing       ≤ 0.27

推荐设置

为引导模型生成高美学值图像,建议使用以下负面提示:

nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]

为获得更高品质结果,建议在提示前添加:

masterpiece, best quality, very aesthetic, absurdres

推荐使用较低的无分类器引导尺度(CFG Scale)约为 5-7,采样步数低于 30,并使用 Euler Ancestral(Euler a)作为采样器。

多宽高比分辨率

本模型支持生成以下尺寸的图像:

尺寸	宽高比
1024 x 1024	1:1 正方形
1152 x 896	9:7
896 x 1152	7:9
1216 x 832	19:13
832 x 1216	13:19
1344 x 768	7:4 横向
768 x 1344	4:7 纵向
1536 x 640	12:5 横向
640 x 1536	5:12 纵向

致谢

Animagine XL 3.1 的开发与发布离不开以下个人与机构的宝贵贡献与支持:

  • SeaArt.ai:我们的合作方与赞助方。

  • Shadow Lilac:提供了美学分类模型 aesthetic-shadow-v2

  • Derrian Distro:提供了自定义学习率调度器,源自 LoRA Easy Training Scripts

  • Kohya SS:提供了全面的训练脚本。

  • Cagliostrolab 合作者:致力于模型训练、项目管理和数据整理。

  • 早期测试者:提供了宝贵反馈与质量保障。

  • NovelAI:其在美学标签方面的创新方法启发了我们的实现。

感谢大家的支持与专业见解,推动了动漫风格图像生成的边界。

局限性

尽管 Animagine XL 3.1 在动漫风格图像生成方面取得了显著进步,但仍需承认其局限性:

  1. 专注动漫风格:本模型专为生成动漫风格图像设计,不适合生成写实照片。

  2. 提示复杂度:该模型可能不适合期望通过简短或简单提示获得高质量结果的用户。训练重点在于概念理解而非美学优化,因此可能需要更详细和具体的提示才能达到理想输出。

  3. 提示格式:Animagine XL 3.1 优化用于 Danbooru 风格标签,而非自然语言提示。为获得最佳效果,建议用户使用适当的标签和语法格式化提示。

  4. 解剖结构与手部渲染:尽管在解剖结构和手部渲染方面有所改进,模型仍可能在这些区域生成次优结果。

  5. 数据集规模:Animagine XL 3.1 的训练数据集包含约 87 万张图像,与前一版本(120 万张)合并后,总训练数据约为 210 万张。尽管规模可观,但仍可能被视为“终极”动漫模型的有限范围。

  6. NSFW 内容:Animagine XL 3.1 被设计为生成更平衡的 NSFW 内容。但请注意,即使未明确提示,模型仍可能生成 NSFW 结果。

通过承认这些局限性,我们旨在提供透明度并为用户设定合理预期。尽管存在这些限制,我们相信该模型在动漫风格图像生成方面迈出了重要一步,为艺术家、设计师和爱好者提供了强大工具。

许可证

Animagine XL 3.1 基于 Animagine XL 3.0,遵循 Fair AI Public License 1.0-SD 许可证,与 Stable Diffusion 模型的许可证兼容。主要要点:

  1. 修改共享:若您修改了 Animagine XL 3.1,必须共享您的修改内容及原始许可证。

  2. 源代码可访问性:若您的修改版本可通过网络访问,请提供一种方式(如下载链接)供他人获取源代码。此要求同样适用于衍生模型。

  3. 分发条款:任何分发必须依据本许可证或另一项具有类似规则的许可证。

  4. 合规要求:若不合规,必须在 30 天内修正,否则许可证将终止,强调透明度与对开源价值观的遵守。

选择此许可证旨在保持 Animagine XL 3.1 的开放性和可修改性,契合开源社区精神。它保护贡献者与使用者,鼓励协作、合乎伦理的开源社区。这确保模型不仅能受益于集体智慧,也尊重开源开发的自由。

最后,Cagliostro 实验室公开服务器:https://discord.gg/cqh9tZgbGc

欢迎加入我们的 Discord 服务器。
如您想捐赠或请我们喝杯咖啡,请访问:Here

非常感谢!^_^

此模型生成的图像

未找到图像。