ChromaYume NoobAI-XL (NAI-XL)
详情
下载文件
模型描述
概述
该模型基于 NOOBAI XL-VPred 1.0 的架构构建,并进行了部分结构修改。
版本 1.0 至 3.0:在 Danbooru2024 数据集,以及 Yande Full 和 e621 上进行训练,并在训练过程中使用 NOOBAI XL-VPred 1.0 和 Illustrious XL 1.0 作为教师模型。
版本 2.0:我使用了旧数据,同时增加了来自互联网多个来源的超过 5 万张真实人物图像。
版本 3.0:我对数据集进行了重构,并使用 ChatGPT o3-mini 添加了更多数据标签,随后进行了人工复核。
版本 4.0:模型在 danbooru2024、danbooru_newest-all 数据集、e621、e621_newest、gelbooru_full、yande_full,以及一个自定义数据集(我使用 GPT-4.5 以自然语言收集并标注,并由我手动验证)上进行训练。
版本 1.0:该模型侧重于在生成图像时平衡多种艺术风格(通过触发提示实现)并保证良好的解剖结构。
版本 2.0:此版本着重于提升解剖结构,使角色更逼真(通过触发提示实现)。请注意,此版本可能会降低多种艺术风格的图像生成质量。
版本 3.0:此版本能生成多种风格的图像(类似版本 1.0),同时创建比版本 2.0 更逼真、更具生命力的角色,且解剖结构更优。然而,要获得理想图像,需输入精确的描述性提示,因为其对输出有显著影响。
在版本 4.0 中,为适应训练所用的大规模数据,我重构了模型并做了一些修改。此外,我不得不训练模型的所有部分,包括 CLIP、VAE 和 UNet。本版本的改进使模型能更准确地生成图像风格,并提升角色解剖结构。同时,我也修复了版本 2.0 和 3.0 中出现的问题。
重要说明
我个人重构了该模型,因此非常感谢任何反馈。您的见解不仅能激励我,还将帮助我更好地理解其优缺点,以便未来进一步优化。
这是一个 V-预测模型(不同于 epsilon-预测),需要特定的参数配置。请参阅用户指南 此处。
目前,该模型无法通过 Civitai 生成功能使用。您可通过以下网站使用它:
生成写实角色的设置
对于版本 2.0 和 3.0:添加以下提示以生成
正向提示:realistic, cosplay, real life, photorealistic
负向提示:illustration, blur, film grain, noise, sketch, comic, cartoon, toon, oil painting (medium), flat color, outline, 3D, 2.5D, 2D, unrealistic, game engine style, anime coloring, smooth skin
推荐设置
正向提示:masterpiece,best quality,amazing quality
负向提示:bad quality,worst quality,worst detail,sketch,censor, simple background,transparent background
CFG:4-6
Clip skip:2
步数:20-30
采样器:Euler a
由 @Ligmanese 提供
采样器:Euler Ancestral CFG++
调度类型:Simple
采样步数:25-30
CFG 缩放:1.2-1.5
注意:
我未使用任何后处理或 LoRA 来增强示例图像。这些图像完全使用上述设置和提示,由我的基础模型生成。
为进行对比和独立评估,我使用了来自不同来源和作者的提示生成这些示例图像。
致谢
感谢 narugo1992 和 Nyanko 分享如此宝贵的数据,以及 Laxhar Lab 提供的优秀模型!
感谢 @Sennke 创建 noobReal 模型!该模型为我改进 ChromaYume 2.0 版本提供了更多灵感。



















