BAXL | Blue Archive Flat Celluloid Style Fine-tune | 碧蓝档案赛璐璐平涂画风 [Kohaku Δ & Animagine XL v3]
详情
下载文件
关于此版本
模型描述
BAXLv3 现已上线!
专注于泛化能力,覆盖大多数版权角色的画风,避免灾难性遗忘/过拟合。
test img @QR0W_
您应期待此更新带来的改进:
更强的泛化能力
更接近《蔚蓝档案》风格
精美的光晕效果
基于 KohakuΔ 的显著提升的 LoRA 兼容性
您不应期待此更新带来的改进:
更好的解剖结构,始终良好的手和脚
使用便捷
对提示词的高度聚焦(相比前一版本)
多人/成人内容支持(此模型不会接近“小马”水平)
详细背景
使用方法:
提示词逻辑与 KohakuΔ 相同。
1girl, <角色>, <通用标签>, <质量标签>
负面提示:
lowres, error, worst quality, low quality, jpeg artifacts, watermark, signature, username
保持提示词简洁清晰,建议提示词长度 < 75 个标记。
建议:
CFG:4-7(更高值可略微改善解剖结构)
采样器:Euler A @ 25步
分辨率:768 - 1792(仅超宽屏),每次步长+32
使用 DanTagGen
设置低温度(<1)
禁用词:
sketch, comic, flat color, .*official.*, .*boy.*, mecha, no humans, text, pixel art, speech bubble标签总长度:简短
使用 Hires.Fix
放大器:DATx2
去噪强度:0.4-0.5
使用 ADetailer
- face_yolov8n.pt
如需生成典型配色,请将配色方案置于提示词开头。
主要变化:
基础模型切换为 KohakuΔ rev1
原因:
AniXL 所使用的美学评分对胶片动画风格不友好,其质量/负面标签过于随意,有时甚至对绘制干净、纤细的线条产生负面影响。此外,AniXL 似乎对某些角色存在过拟合。
👆坦白说,我尚未在 AniXL3.1 上使用相同的训练方法。也许通过我最终的训练配置可以修复这个问题。
同时,KohakuΔ 训练不足,意味着更具灵活性,更友好于微调艺术风格。
我不知道如何像 AniXL3.1 那样打标签,但我熟悉 KohakuΔ 的标签方法,因为我能从 Hakubooru 获取完全相同的训练数据集。
更强的泛化能力与横向构图:
KohakuΔ rev1 在解剖结构与构图方面表现不佳,原因是训练时间不足(双 3090,你还能指望啥?)
由于正则化,本次微调确实有所改善(尤其是横向图像),但我不骗你,BAXLv3-Δ 非常容易 生成糟糕的手部或多余腿部,若提示词存在问题(过长/语义重复/标签顺序不当),情况会更糟。
正则化 / 数据集更新:
正则化 Danbooru 数据集,类别标记 = solo:
1000+ 横向图像
收藏数 > 30
标签为 "1girl, solo"
1000+ 纵向图像
收藏数 > 30
标签为 "1girl, solo"
作者为胶片动画风格或《蔚蓝档案》风格模仿者
数据集更新至 0068 活动 CG,并包含第5次PV截图。
训练细节:
图像数量:574 张(无重复)
min_bucket_reso = 256
max_bucket_reso = 4096
bucket_reso_steps = 32
train_batch_size = 2
gradient_accumulation_steps = 32
learning_rate = 7.5e-6(仅 Unet)
lr_scheduler = "constant_with_warmup"
lr_warmup_steps = 100
optimizer_type = "Lion8bit"
min_snr_gamma = 5
Batch size = 2
mixed_precision = "fp16"
full_fp16 = true
optimizer_args = ["weight_decay=0.1", "betas=0.9,0.95"]
shuffle_caption = true
weighted_captions = false
keep_tokens = 0
caption_tag_dropout_rate = 0.1
已知问题:
halo/heterochromia/.*focus.*在某些情况下似乎过拟合,可通过将其加入负面提示缓解。背景不稳定,即使输入
simple background, white background仍可能绘制出无关内容。
许可证与免责声明
许可证:
免责声明:
根据**《蔚蓝档案》同人创作指南》**(日文 | 中文),本模型不得用于任何商业用途,包括但不限于出售本模型或其合并模型、出售本模型生成的图像或其合并模型的图像,或在 Patreon/Fanbox 等营利平台提供“付费会员独占”服务。
===========XLv2 信息===========
简要说明:
基于 Animagine XL V3,使用《蔚蓝档案》官方艺术作品作为微调数据集以学习其风格。禁止将本模型用于任何商业用途。使用前请仔细阅读下方免责声明。
使用方法:
建议提示词顺序:
- 角色名,1girl,其他标签,质量标签
推荐质量标签(请删除提示词中其他质量标签):
flat_coating clear_color highres absurdres best_quality切勿使用
masterpiece生成普通图像,这会破坏“平面涂层”效果。
推荐负面提示:
nsfw, lowres, worst quality, low quality, bad perspective, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, jpeg artifacts, signature, watermark, username, artist name切勿使用
blurry作为负面提示。
推荐分辨率:与 A3XL 相同,但纵向限制为 1600x900,横向分辨率较低。
更高分辨率 = 更接近《蔚蓝档案》风格
CFG 5,Euler A,25 步
可将本模型视为 Animagine XL V3,所有标签使用方式相同。
基于 Animagine XL V3 的 LoRA 可正常工作。
推荐放大器:AnimeVideo v3
未进行配色方案训练
欢迎提供反馈,我需要您的建议以推动后续开发。
免责声明:
Animagine XL V3 的许可证要求,基于该模型的合并版本必须以相同授权方式发布,即允许用户使用生成服务或售卖模型生成的图像。
但根据《《蔚蓝档案》同人创作指南》(日文 | 中文),本模型(BArtstyle)不得用于任何形式的商业用途,包括但不限于出售本模型或其合并模型、出售本模型生成的图像或其合并模型的图像,或在 Patreon/Fanbox 等众筹平台提供“付费会员限定”服务。
本模型的许可证变更已获得 Animagine XL 作者 Cagliostro Research Lab 的授权。再次衷心感谢他们对开源社区的理解与奉献。(授权来源)
免责声明:
根据 Animagine XL V3 的许可证,基于该模型的衍生模型应以相同授权方式公开,即允许用户使用线上生成服务,或售卖该模型生成的图片。
但根据《<蔚蓝档案>同人创作指引》 ( 日文 | 中文 ),此模型(BArtstyle)**不得用于任何形式的商业用途,**包括但不限于售卖该模型及其衍生模型自身或其生成的图片,或Patreon/Fanbox等众筹平台的“订阅会员限定”服务。
该许可证授权范围变更得到 Animagine XL 作者 Cagliostro Research Lab 的许可。
在这里再次感谢他们的理解,以及他们对于开源社区的贡献。(授权来源)
===========XLv1 信息===========
使用方法:
本模型仍处于 ALPHA 阶段,训练严重不足,仅对《蔚蓝档案》角色效果最佳。
可将本模型视为 Animagine XL V3,所有标签使用方式相同。
基于 Animagine XL V3 的 LoRA 可正常工作。
推荐放大器:AnimeVideo v3
仍使用类似 BArtstyleDBv1 的颜色标签训练,但效果似乎不明显。
欢迎提供反馈,我需要您的建议以推动后续开发。
训练细节:
AdamW8bit
200 张图像@1024x1024
200 轮次@批处理大小 1
UNET:1E-5
TE1/TE2:5E-6
余弦退火,15 次重启
===========DBv1 信息===========
使用方法:
正向提示:
与 BArtstyle LoRA 类似,配色方案仍有效,我成功使
蓝色主题或粉色主题等典型配色更接近原始数据,且未过拟合。自然语言 + 低 CFG(4.5-6)+ 随机生成 + 精选 > “质量标签”
根据我的测试,约 30% 的图像初看即可达到良好效果。如您无法获得相似结果,请检查提示词中是否存在重复/冲突标签,缩短提示词并降低 CFG 值。
负面提示:
除非您清楚自己在做什么,否则切勿使用超长负面提示!
用于随机生成时,Simple EasyNegativeV2 已足够。
如您认为模型仍存在过多“仿冒”风格,可尝试在负面提示中加入
glowing, 3d, painting \(medium\), photorealistic, nsfw,但效果无法保证。
采样器: Euler A
步数:50-100
是的,CHAD Euler A 仍优于原版 DPM
放大器: AnimeVideo v3
步数:10-15
去噪强度:0.45-0.55
基础模型:
-
经过6个月等待,作者发布了 CFv3 的 VAE 修复版本。原版存在严重 VAE 问题,导致所有 CFv3 LoRA 均受影响,即使更换 VAE 也无法修复。强烈建议使用此修复版本。
似乎是 唯一 能兼容 NAI 1.0 LoRA 的训练模型,意味着它是唯一适合微调的模型。
数据集:
200 张《蔚蓝档案》官方艺术作品 + 翻转,共计 400 张。
与 BArtstyle LoRA 相比,数据集已彻底重构。
使用可找到的最高分辨率,并裁剪以提升数据质量
使用 XnConvert 下采样至 1280x1280
训练设置:
优化器: AdamW8bit
调度器: 带预热的恒定学习率
- 预热至总步数的 10%
UNET 学习率: 1e-6
TE 学习率: 1.25-7
建议为 UNET 学习率的 1/8
在总步数的 50% 处停止 TE 训练
轮次: 100
批处理大小: 1
步数: 40000
分辨率: 1280x1280
耗时: 10小时27分钟




















