Animagine XL 4.0
详情
下载文件
关于此版本
模型描述
请阅读我们关于提示词的深入指南: Cagliostrolab 博客
概述
Animagine XL 4.0,亦可写作 Anim4gine,是终极的动漫风格微调 SDXL 模型,也是 Animagine XL 系列 的最新版本。尽管是前代产品的延续,本模型基于 Stable Diffusion XL 1.0 重新训练,使用了来自多种来源的 840 万张多样化的动漫风格图像数据集,知识截止日期为 2025 年 1 月 7 日,并经过约 2650 小时的 GPU 训练。与前一版本类似,本模型采用标签排序方法进行身份与风格训练。
随着 Animagine XL 4.0 Opt(优化版) 的发布,模型通过额外数据集进一步优化,显著提升了稳定性、人体结构准确性、降噪能力、色彩饱和度和整体色彩准确性。这些改进使 Animagine XL 4.0 Opt 在保持系列标志性品质的同时,输出更加一致且视觉效果更佳。
更新日志
- 2025-02-13 – 新增 Animagine XL 4.0 Opt 和 Animagine XL 4.0 Zero
输出更稳定,一致性更高
增强人体结构,比例更准确
减少生成过程中的噪点与伪影
修复低饱和度问题,色彩更丰富
提升色彩准确性,视觉效果更佳
- 2025-01-24 – 首次发布
模型详情
开发方:Cagliostro 研究实验室
模型类型:基于扩散的文本到图像生成模型
模型描述:此模型可用于根据文本提示生成和修改特定动漫风格的图像
使用指南
提示词规范摘要见下图:

1. 提示词结构
该模型使用基于标签的描述和标签排序方法进行训练。请使用以下结构模板:
1girl/1boy/1other, 角色名, 来自哪部作品, 评级, 其余内容可任意顺序排列,最后以质量增强词结尾
2. 质量增强标签
在提示词末尾添加以下标签:
masterpiece, high score, great score, absurdres
3. 推荐负面提示词
lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry
4. 最佳参数设置
CFG Scale:4-7(推荐 5)
采样步数:25-28(推荐 28)
推荐采样器:Euler Ancestral (Euler a)
5. 推荐分辨率

6. 最终提示词示例
1girl, firefly \(honkai: star rail\), honkai \(series\), honkai: star rail, safe, casual, solo, looking at viewer, outdoors, smile, reaching towards viewer, night, masterpiece, high score, great score, absurdres
特殊标签
该模型支持多种特殊标签,可用于控制图像生成过程的各个方面。这些标签经过精心加权与测试,确保在不同提示词下输出一致。
质量标签
质量标签是直接影响图像整体质量和细节水平的基础控制项。可用质量标签:
masterpiecebest qualitylow qualityworst quality
评分标签
评分标签相较于基础质量标签,能提供更精细的图像质量控制,在本模型中对输出质量的影响更强。可用评分标签:
high scoregreat scoregood scoreaverage scorebad scorelow score
时间标签
时间标签可依据特定年代影响艺术风格,适用于生成具有时代特征的图像。支持的年份标签:
year 2005year {n}year 2025
评级标签
评级标签用于控制生成图像的内容安全级别。请负责任地使用,并遵守适用法律与平台政策。支持的评级:
safesensitivensfwexplicit
训练信息
本模型采用最先进的硬件和优化的超参数进行训练,以确保最高质量的输出。以下是训练过程中使用的详细技术规格与参数:

致谢
本长期项目离不开 Stability AI、Novel AI 和 Waifu Diffusion 团队 的开创性工作、创新贡献与详尽文档的支持。我们特别感谢 Main 的 Kickstarter 资助,使我们得以超越 V2 版本。对于本次迭代,我们衷心感谢社区每一位成员的持续支持,尤其感谢:
Moescape AI:我们在模型分发与测试方面的宝贵合作伙伴
Lesser Rabbit:提供关键的计算与研究资助
Kohya SS:开发了全面的开源训练框架
discus0434:创建了行业领先的开源美学预测器 2.5
早期测试者:为提供关键反馈与全面质量保证所付出的努力
贡献者
我们衷心感谢为本项目做出重要贡献的全体团队成员,包括但不限于:
模型
Gradio
关系、财务与质量保证
数据
筹款现已重新开放!
我们很高兴推出通过 GitHub Sponsors 支持训练、研究和模型开发的新筹款方式。您的支持将帮助我们拓展 AI 技术的边界。
您可以通过以下方式帮助我们:
捐赠:通过以下地址捐赠 ETH 或 USDT。
分享:宣传我们的模型,并分享您的创作!
反馈:告诉我们如何改进。
捐赠地址:
ETH/USDT/USDC(e): 0xd8A1dA94BA7E6feCe8CfEacc1327f498fCcBFC0C
GitHub 赞助:https://github.com/sponsors/cagliostrolab/
为何使用加密货币?
我们最初通过 Ko-fi 和 PayPal 进行筹款时,尽管努力解释项目用途,我们的 PayPal 账户仍被标记并最终封禁。这迫使我们退还全部捐款,也使我们失去可靠的收款渠道。为避免此类问题并确保透明度,我们现已改用加密货币作为主要筹资方式。
想用非加密货币捐赠?
虽然我们与 PayPal 的经历不佳,若您仍希望支持我们但不愿使用加密货币,请通过 Discord 服务器 联系我们,获取其他捐赠方式。
加入我们的 Discord 服务器
欢迎加入我们的 Discord 服务器:https://discord.gg/cqh9tZgbGc
局限性
提示词格式:仅支持基于标签的文本提示;自然语言输入效果有限
人体结构:可能难以准确处理复杂解剖细节,特别是手部姿势与手指数量
文本生成:当前不支持图像中生成文字,不建议使用
新角色:由于训练数据有限,近期角色准确率可能较低
多角色场景:多角色场景需精细设计提示词
分辨率:高分辨率(如 1536x1536)可能出现质量下降,因训练基于原始 SDXL 分辨率
风格一致性:可能需要使用特定风格标签,因训练更侧重身份保留而非风格一致性
许可证
本模型采用 Stability AI 的原始 CreativeML Open RAIL++-M 许可证,未做任何修改或附加限制。许可证条款完全遵循原始 SDXL 许可证,包括:
✅ 允许:商业用途、修改、分发、私人使用
❌ 禁止:非法活动、生成有害内容、歧视、剥削
⚠️ 要求:附上许可证副本、标明修改内容、保留原始声明
📝 免责声明:按“原样”提供,无任何担保
请参阅 原始 SDXL 许可证 以获取完整权威条款。

