Animagine XL V3.1
详情
下载文件
关于此版本
模型描述
Animagine XL 3.1 是 Animagine XL V3 系列的更新版本,对前一版本 Animagine XL 3.0 进行了增强。这个开源的动漫主题文本到图像模型经过改进,能够生成更高品质的动漫风格图像。它包含了更多来自知名动漫系列的角色、优化的数据集,以及用于提升图像生成效果的新美学标签。基于 Stable Diffusion XL 构建,Animagine XL 3.1 致力于为动漫爱好者、艺术家和内容创作者提供准确且细致的动漫角色表现,成为宝贵的资源。
模型详情
合作方:SeaArt.ai
模型类型:基于扩散的文本到图像生成模型
模型描述:Animagine XL 3.1 能够根据文本提示生成高质量的动漫图像。其优势包括增强的手部解剖结构、改进的概念理解能力和先进的提示解析能力。
微调自:Animagine XL 3.0
使用指南
标签顺序
为获得最佳效果,建议遵循以下结构化提示模板,因为我们的模型正是按此方式训练的:
1girl/1boy, 角色名称, 来自哪部作品, 其余内容顺序任意。
特殊标签
Animagine XL 3.1 使用特殊标签来引导生成结果在质量、评级、创作年代和美学风格上的表现。虽然模型在不使用这些标签的情况下也能生成图像,但使用它们有助于获得更佳效果。
质量修饰符
质量标签现在综合考虑评分和后续评级,以确保质量分布的均衡性。我们对标签进行了优化以提高清晰度,例如将“high quality”改为“great quality”。
质量修饰符 评分标准
masterpiece > 95%
best quality > 85% 且 ≤ 95%
great quality > 75% 且 ≤ 85%
good quality > 50% 且 ≤ 75%
normal quality > 25% 且 ≤ 50%
low quality > 10% 且 ≤ 25%
worst quality ≤ 10%
评级修饰符
我们还简化了评级标签,以提升简洁性和清晰度,旨在建立可跨不同模型应用的通用规则。例如,“rating: general”现在简化为“general”,“rating: sensitive”简化为“sensitive”。
评级修饰符 评级标准
safe 通用
sensitive 敏感
nsfw 有疑问
explicit, nsfw 露骨
年代修饰符
我们重新定义了年代范围,以更精确地引导结果趋向特定的现代或复古动漫艺术风格。此次更新简化了范围,聚焦于与当前及过往时代的相关性。
年代标签 年代范围
newest 2021 至 2024
recent 2018 至 2020
mid 2015 至 2017
early 2011 至 2014
oldest 2005 至 2010
美学标签
我们通过引入美学标签增强了标签系统,以根据视觉吸引力细化内容分类。这些标签源自一个专门针对动漫数据训练的 ViT(视觉变换器)图像分类模型的评估结果。为此,我们使用了模型 shadowlilac/aesthetic-shadow-v2,该模型在训练前评估内容的美学价值,确保每份内容不仅相关准确,而且视觉上具有吸引力。
美学标签 评分范围
very aesthetic > 0.71
aesthetic > 0.45 且 < 0.71
displeasing > 0.27 且 < 0.45
very displeasing ≤ 0.27
推荐设置
为引导模型生成高美学值图像,建议使用以下负面提示:
nsfw, lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract]
为获得更高品质结果,建议在提示前添加:
masterpiece, best quality, very aesthetic, absurdres
推荐使用较低的无分类器引导尺度(CFG Scale)约为 5-7,采样步数低于 30,并使用 Euler Ancestral(Euler a)作为采样器。
多宽高比分辨率
本模型支持生成以下尺寸的图像:
尺寸 宽高比
1024 x 1024 1:1 正方形
1152 x 896 9:7
896 x 1152 7:9
1216 x 832 19:13
832 x 1216 13:19
1344 x 768 7:4 横向
768 x 1344 4:7 纵向
1536 x 640 12:5 横向
640 x 1536 5:12 纵向
致谢
Animagine XL 3.1 的开发与发布离不开以下个人与机构的宝贵贡献与支持:
SeaArt.ai:我们的合作方与赞助方。
Shadow Lilac:提供了美学分类模型 aesthetic-shadow-v2。
Derrian Distro:提供了自定义学习率调度器,源自 LoRA Easy Training Scripts。
Kohya SS:提供了全面的训练脚本。
Cagliostrolab 合作者:致力于模型训练、项目管理和数据整理。
早期测试者:提供了宝贵反馈与质量保障。
NovelAI:其在美学标签方面的创新方法启发了我们的实现。
感谢大家的支持与专业见解,推动了动漫风格图像生成的边界。
局限性
尽管 Animagine XL 3.1 在动漫风格图像生成方面取得了显著进步,但仍需承认其局限性:
专注动漫风格:本模型专为生成动漫风格图像设计,不适合生成写实照片。
提示复杂度:该模型可能不适合期望通过简短或简单提示获得高质量结果的用户。训练重点在于概念理解而非美学优化,因此可能需要更详细和具体的提示才能达到理想输出。
提示格式:Animagine XL 3.1 优化用于 Danbooru 风格标签,而非自然语言提示。为获得最佳效果,建议用户使用适当的标签和语法格式化提示。
解剖结构与手部渲染:尽管在解剖结构和手部渲染方面有所改进,模型仍可能在这些区域生成次优结果。
数据集规模:Animagine XL 3.1 的训练数据集包含约 87 万张图像,与前一版本(120 万张)合并后,总训练数据约为 210 万张。尽管规模可观,但仍可能被视为“终极”动漫模型的有限范围。
NSFW 内容:Animagine XL 3.1 被设计为生成更平衡的 NSFW 内容。但请注意,即使未明确提示,模型仍可能生成 NSFW 结果。
通过承认这些局限性,我们旨在提供透明度并为用户设定合理预期。尽管存在这些限制,我们相信该模型在动漫风格图像生成方面迈出了重要一步,为艺术家、设计师和爱好者提供了强大工具。
许可证
Animagine XL 3.1 基于 Animagine XL 3.0,遵循 Fair AI Public License 1.0-SD 许可证,与 Stable Diffusion 模型的许可证兼容。主要要点:
修改共享:若您修改了 Animagine XL 3.1,必须共享您的修改内容及原始许可证。
源代码可访问性:若您的修改版本可通过网络访问,请提供一种方式(如下载链接)供他人获取源代码。此要求同样适用于衍生模型。
分发条款:任何分发必须依据本许可证或另一项具有类似规则的许可证。
合规要求:若不合规,必须在 30 天内修正,否则许可证将终止,强调透明度与对开源价值观的遵守。
选择此许可证旨在保持 Animagine XL 3.1 的开放性和可修改性,契合开源社区精神。它保护贡献者与使用者,鼓励协作、合乎伦理的开源社区。这确保模型不仅能受益于集体智慧,也尊重开源开发的自由。
最后,Cagliostro 实验室公开服务器:https://discord.gg/cqh9tZgbGc
欢迎加入我们的 Discord 服务器。
如您想捐赠或请我们喝杯咖啡,请访问:Here
非常感谢!^_^




