Kirazuri Lazuli (Noobai V-Pred)

详情

下载文件

模型描述

Kirazuri Lazuli (Noobai V-Pred)

本检查点为 NoobAI-XL (NAI-XL) V-Pred 1.0版本 的完整微调版,由本人在4090显卡上本地训练,使用包含15,069张图像的数据集,共计训练378,550步,从基础模型开始训练约370 GPU小时,每步耗时3.52秒。

本模型旨在补充基础模型数据截断(2024/10/24)之后的新知识,涵盖动漫、电子游戏及虚拟YouTuber的风格、概念与角色。

使用方法 — 重要提示

本模型基于 NoobAI-XL (NAI-XL) V-Pred 1.0版本 训练,该模型采用v-prediction架构(与eps-prediction不同),需特定参数配置。

建议在使用本检查点前,先熟悉基础模型及其使用说明。

训练的主要目标是扩展基础模型的知识,同时不显著改变其使用方式或削弱其原有知识。


以下为我的个人设置,您对基础模型的偏好设置大多可直接迁移。

采样器方面:生成使用 Euler,放大/修复使用 Euler Ancestral

(⚠️ 其他采样器可能无法正常工作,包括CivitAI默认的某些采样器如Karras。)

预览图通过 ComfyUI 工作流生成,使用了 DynamicThresholdingFull、放大功能及 FaceDetailer

动态阈值(CFG-Fix)设置配合CFG=10使用:

dynthres_enabled: True, dynthres_mimic_scale: 7, dynthres_threshold_percentile: 1, dynthres_mimic_mode: Half Cosine Down, dynthres_mimic_scale_min: 1, dynthres_cfg_mode: Half Cosine Down, dynthres_cfg_scale_min: 3, dynthres_sched_val: 1, dynthres_separate_feature_channels: enable, dynthres_scaling_startpoint: ZERO, dynthres_variability_measure: STD, dynthres_interpolate_phi: 1

reForgeForge 也可使用(自1.0版本起已解决兼容性问题,如您曾遇到该版本问题,深表歉意)。

*为使Forge/reForge能自动识别为v-pred模型,已通过此脚本向模型状态字典中添加了 znstrv_pred 键。

推荐提示结构:

质量修饰语 masterpiece, best quality, very aesthetic 应置于提示末尾

艺术家名称可加前缀 artist: 以避免与概念词发生token渗漏。

在ComfyUI中通过 comfyui-prompt-control 插件使用A1111提示语法组合艺术家风格,例如:artist:[artist1|artist2|artist3]

某些情况下,使用 Attention Couple 进行区域提示(示例)。

正向提示:

{{characters}}, {{copywrites}}, {{artists}},
{{tags}},
absurdres, masterpiece, best quality, very aesthetic

训练详情

使用的训练配置来自 kohya-ss/sd-scripts,详见 GitHub

v2.1

本版本新增了更新的个人审美微调数据集(masterpieces)及近期角色、服装与风格:

  • 数据截止:2025/07/15

  • 在v2.0基础上继续训练

  • 训练图像:1,004张

  • 正则化图像:314张(由v2.0生成)

  • 优化器:Adafactor

  • 训练精度:全精度fp32

  • 批量大小:4

  • U-Net学习率:6e-6

  • TE学习率:2e-6

  • 迭代次数:50

  • 步数:25,950

v2.0

本版本对目标训练的角色、概念与风格有了更全面的表达。

在完整数据集上进行单次训练,并整合了最新数据:

  • 数据截止:2025/06/13

  • 训练图像:14,065张

  • 正则化图像:7,056张(由NoobAI-XL (NAI-XL) V-Pred 1.0版本生成)

  • 优化器:Adafactor

  • 训练精度:全精度fp32

  • 批量大小:4

  • U-Net学习率:6e-6

  • TE学习率:2e-6

  • 迭代次数:50

  • 步数:352,600(约344 GPU小时,每步3.52秒)

v1.1

采用迭代检查点训练方式,受 PixelWave 启发。

训练分10轮进行,每轮使用约1200张图像的数据批次,最后以第11轮267张图像的审美微调数据集完成训练。

  • 数据截止:2025/05/25

  • 优化器:Adafactor

  • 训练精度:全精度fp32

  • 批量大小与学习率多次调整

    • 批量大小4,学习率6e-6最稳定
  • 第10与第11轮训练中,TE学习率设为批量大小4,学习率2e-6

  • 正则化数据集基于第10轮检查点生成,用于在最终审美训练中保留已习得角色

新增训练的系列/角色列表:

更多已训练概念的预览见 版本2.0

动漫:

  • dandadan

  • dr. stone

  • gachiakuta

  • girumasu

  • gundam gquuuuuux

  • kaijuu no.8

  • kaoru hana wa rin to saku

  • kusuriya no hitorigoto

  • solo leveling

  • sono bisque doll wa koi wo suru

  • witch watch

  • yofukashi no uta

电子游戏:

  • elden ring nightreign

  • metaphor: refantazio

  • monster hunter wilds

  • fate/go (lilith)

  • genshin impact (citlali, escoffier, lan-yan, varesa, xilonen, yumemizuki mizuki)

  • honkai star rail (aglaea, castorice, cipher)

  • wuthering waves (carlotta, cartethyia, chisa, ciaccona, zani)

  • zenless zone zero (astra-zao, cipher, ju-fufu, luciana de montefio, pulchra fellini, sweety, trigger, vivian-banshee, yi xuan)

Hololive:

  • flow glow (isaki riona, kikirara vivi, koganei niko, mizumiya su, rindo chihaya)

  • hoshimachi suisei (11th, caramel-pain, kireigoto, spectra-of-nova, supernova)

  • himemori luna (7th)

  • houshou marine (ahoy pirates)

  • natsuiro matsuri (jersey maid)

  • nekomata okayu (personya respect)

  • ookami mio (8th)

  • oozora subaru (police)

  • roboco san (oriental)

  • shirakami fubuki (fbkingdom)

  • usada-pekora (10th)

独立虚拟主播:

  • amagai ruka

  • dooby

  • nimi nightmate

  • sameko saba

  • yuuki sakuna

其他:

  • myaku-myaku (expo2025)

训练的概念列表:

服装:

  • 古希腊服饰

  • chronopattern dress

  • jirai kei

  • 水裙

  • holonatsu paradise(服饰)

概念:

  • 破除第四面墙

  • 星轨

  • 花田

  • mechabare

  • 怪物娘

  • 蛇年

推荐风格控制标签:

从103位艺术家数据集中精选的风格触发词:

  • blending

  • flat color

  • no lineart

  • impasto

  • painterly

  • chiaroscuro

  • impressionism

  • ink wash painting

  • pastel colors

  • pencil art

  • neon palette

  • dark

  • colorful

传统媒介标签亦已训练:

(部分因数据不足未充分支持)

  • traditional media

  • acrylic paint \(medium\)

  • ballpoint pen \(medium\)

  • brush \(medium\)

  • calligraphy brush \(medium\)

  • charcoal \(medium\)

  • colored pencil \(medium\)

  • color ink \(medium\)

  • crayon \(medium\)

  • gouache \(medium\)

  • graphite \(medium\)

  • ink \(medium\)

  • marker \(medium\)

  • millipen \(medium\)

  • nib pen \(medium\)

  • oil painting \(medium\)

  • painting \(medium\)

  • pastel \(medium\)

  • watercolor \(medium\)

致谢

感谢 Laxhar Lab 提供 NoobAI-XL (NAI-XL) V-Pred 1.0版本 基础模型。

感谢 narugo1992deepghs 团队开源各类训练集、图像处理工具与模型。

感谢 kohya-ss 提供 sd-scripts 训练器。

许可协议

本模型未对基础模型 Noobai License 进行任何修改,其条款如下:


本模型的许可继承自 https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0fair-ai-public-license-1.0-sd,并附加以下条款。任何对本模型及其衍生版本的使用均受本许可约束。

I. 使用限制

  • 禁止用于有害、恶意或非法活动,包括但不限于骚扰、威胁和传播虚假信息。

  • 禁止生成不道德或冒犯性内容。

  • 禁止违反用户所在地法律法规。

II. 禁止商业化

禁止任何形式的商业化,包括但不限于对模型、衍生模型或模型生成产品的盈利或商业用途。

III. 开源社区

为促进活跃的开源社区,用户必须遵守以下要求:

  • 必须开源基于本模型的衍生模型、合并模型、LoRAs及相关产品。

  • 必须公开工作细节,如合成公式、提示词与工作流。

  • 遵守fair-ai-public-license,确保衍生作品保持开源。

IV. 免责声明

生成的模型可能产生意外或有害输出。用户须自行承担所有使用风险及潜在后果。

此模型生成的图像

未找到图像。