BAXL | Blue Archive Flat Celluloid Style Fine-tune | 碧蓝档案赛璐璐平涂画风 [Kohaku Δ & Animagine XL v3]

详情

模型描述

BAXLv3 现已上线!

专注于泛化能力,覆盖大多数版权角色的画风,避免灾难性遗忘/过拟合。

test img @QR0W_

您应期待此更新带来的改进:

  • 更强的泛化能力

  • 更接近《蔚蓝档案》风格

  • 精美的光晕效果

  • 基于 KohakuΔ 的显著提升的 LoRA 兼容性

您不应期待此更新带来的改进:

  • 更好的解剖结构,始终良好的手和脚

  • 使用便捷

  • 对提示词的高度聚焦(相比前一版本)

  • 多人/成人内容支持(此模型不会接近“小马”水平)

  • 详细背景

使用方法:

提示词逻辑与 KohakuΔ 相同。

1girl, <角色>, <通用标签>, <质量标签>

负面提示:

lowres, error, worst quality, low quality, jpeg artifacts, watermark, signature, username

保持提示词简洁清晰,建议提示词长度 < 75 个标记。

建议:

  1. CFG:4-7(更高值可略微改善解剖结构)

  2. 采样器:Euler A @ 25步

  3. 分辨率:768 - 1792(仅超宽屏),每次步长+32

  4. 使用 DanTagGen

    • 设置低温度(<1)

    • 禁用词:sketch, comic, flat color, .*official.*, .*boy.*, mecha, no humans, text, pixel art, speech bubble

    • 标签总长度:简短

  5. 使用 Hires.Fix

    • 放大器:DATx2

    • 去噪强度:0.4-0.5

  6. 使用 ADetailer

  7. 如需生成典型配色,请将配色方案置于提示词开头。

主要变化:

基础模型切换为 KohakuΔ rev1

原因:

  • AniXL 所使用的美学评分对胶片动画风格不友好,其质量/负面标签过于随意,有时甚至对绘制干净、纤细的线条产生负面影响。此外,AniXL 似乎对某些角色存在过拟合。

  • 👆坦白说,我尚未在 AniXL3.1 上使用相同的训练方法。也许通过我最终的训练配置可以修复这个问题。

  • 同时,KohakuΔ 训练不足,意味着更具灵活性,更友好于微调艺术风格。

  • 我不知道如何像 AniXL3.1 那样打标签,但我熟悉 KohakuΔ 的标签方法,因为我能从 Hakubooru 获取完全相同的训练数据集。

更强的泛化能力与横向构图:

  • KohakuΔ rev1 在解剖结构与构图方面表现不佳,原因是训练时间不足(双 3090,你还能指望啥?)

  • 由于正则化,本次微调确实有所改善(尤其是横向图像),但我不骗你,BAXLv3-Δ 非常容易 生成糟糕的手部或多余腿部,若提示词存在问题(过长/语义重复/标签顺序不当),情况会更糟。

正则化 / 数据集更新:

  • 正则化 Danbooru 数据集,类别标记 = solo:

    • 1000+ 横向图像

      • 收藏数 > 30

      • 标签为 "1girl, solo"

    • 1000+ 纵向图像

      • 收藏数 > 30

      • 标签为 "1girl, solo"

      • 作者为胶片动画风格或《蔚蓝档案》风格模仿者

  • 数据集更新至 0068 活动 CG,并包含第5次PV截图。

训练细节:

  • 图像数量:574 张(无重复)

  • min_bucket_reso = 256

  • max_bucket_reso = 4096

  • bucket_reso_steps = 32

  • train_batch_size = 2

  • gradient_accumulation_steps = 32

  • learning_rate = 7.5e-6(仅 Unet)

  • lr_scheduler = "constant_with_warmup"

  • lr_warmup_steps = 100

  • optimizer_type = "Lion8bit"

  • min_snr_gamma = 5

  • Batch size = 2

  • mixed_precision = "fp16"

  • full_fp16 = true

  • optimizer_args = ["weight_decay=0.1", "betas=0.9,0.95"]

  • shuffle_caption = true

  • weighted_captions = false

  • keep_tokens = 0

  • caption_tag_dropout_rate = 0.1

已知问题:

  • halo / heterochromia / .*focus.* 在某些情况下似乎过拟合,可通过将其加入负面提示缓解。

  • 背景不稳定,即使输入 simple background, white background 仍可能绘制出无关内容。

许可证与免责声明

  • 许可证

    Fair AI Public License 1.0-SD

  • 免责声明

    根据**《蔚蓝档案》同人创作指南》**(日文 | 中文),本模型不得用于任何商业用途,包括但不限于出售本模型或其合并模型、出售本模型生成的图像或其合并模型的图像,或在 Patreon/Fanbox 等营利平台提供“付费会员独占”服务。

===========XLv2 信息===========

简要说明:

基于 Animagine XL V3,使用《蔚蓝档案》官方艺术作品作为微调数据集以学习其风格。禁止将本模型用于任何商业用途。使用前请仔细阅读下方免责声明。

使用方法:

  • 建议提示词顺序:

    • 角色名,1girl,其他标签,质量标签
  • 推荐质量标签(请删除提示词中其他质量标签):

    • flat_coating clear_color highres absurdres best_quality

    • 切勿使用 masterpiece 生成普通图像,这会破坏“平面涂层”效果。

  • 推荐负面提示:

    • nsfw, lowres, worst quality, low quality, bad perspective, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, jpeg artifacts, signature, watermark, username, artist name

    • 切勿使用 blurry 作为负面提示。

  • 推荐分辨率:与 A3XL 相同,但纵向限制为 1600x900,横向分辨率较低。

    • 更高分辨率 = 更接近《蔚蓝档案》风格

    • CFG 5,Euler A,25 步

  • 可将本模型视为 Animagine XL V3,所有标签使用方式相同。

  • 基于 Animagine XL V3 的 LoRA 可正常工作。

  • 推荐放大器:AnimeVideo v3

  • 未进行配色方案训练

  • 欢迎提供反馈,我需要您的建议以推动后续开发。

免责声明:

Animagine XL V3 的许可证要求,基于该模型的合并版本必须以相同授权方式发布,即允许用户使用生成服务或售卖模型生成的图像。

但根据《《蔚蓝档案》同人创作指南》日文 | 中文),本模型(BArtstyle)不得用于任何形式的商业用途,包括但不限于出售本模型或其合并模型、出售本模型生成的图像或其合并模型的图像,或在 Patreon/Fanbox 等众筹平台提供“付费会员限定”服务。

本模型的许可证变更已获得 Animagine XL 作者 Cagliostro Research Lab 的授权。再次衷心感谢他们对开源社区的理解与奉献。授权来源

免责声明:

根据 Animagine XL V3 的许可证,基于该模型的衍生模型应以相同授权方式公开,即允许用户使用线上生成服务,或售卖该模型生成的图片。

但根据《<蔚蓝档案>同人创作指引》 ( 日文 | 中文 ),此模型(BArtstyle)**不得用于任何形式的商业用途,**包括但不限于售卖该模型及其衍生模型自身或其生成的图片,或Patreon/Fanbox等众筹平台的“订阅会员限定”服务。

该许可证授权范围变更得到 Animagine XL 作者 Cagliostro Research Lab 的许可。

在这里再次感谢他们的理解,以及他们对于开源社区的贡献。(授权来源

===========XLv1 信息===========

使用方法:

本模型仍处于 ALPHA 阶段,训练严重不足,仅对《蔚蓝档案》角色效果最佳。

  • 可将本模型视为 Animagine XL V3,所有标签使用方式相同。

  • 基于 Animagine XL V3 的 LoRA 可正常工作。

  • 推荐放大器:AnimeVideo v3

  • 仍使用类似 BArtstyleDBv1 的颜色标签训练,但效果似乎不明显。

  • 欢迎提供反馈,我需要您的建议以推动后续开发。

训练细节:

AdamW8bit

200 张图像@1024x1024

200 轮次@批处理大小 1

UNET:1E-5

TE1/TE2:5E-6

余弦退火,15 次重启

===========DBv1 信息===========

使用方法:

  • 正向提示:

    • BArtstyle LoRA 类似,配色方案仍有效,我成功使 蓝色主题粉色主题 等典型配色更接近原始数据,且未过拟合。

    • 自然语言 + 低 CFG(4.5-6)+ 随机生成 + 精选 > “质量标签”

    • 根据我的测试,约 30% 的图像初看即可达到良好效果。如您无法获得相似结果,请检查提示词中是否存在重复/冲突标签,缩短提示词并降低 CFG 值。

  • 负面提示:

    • 除非您清楚自己在做什么,否则切勿使用超长负面提示!

    • 用于随机生成时,Simple EasyNegativeV2 已足够。

    • 如您认为模型仍存在过多“仿冒”风格,可尝试在负面提示中加入 glowing, 3d, painting \(medium\), photorealistic, nsfw,但效果无法保证。

  • VAE: WD1-4-kl-f8-anime2-bless09.ckpt

  • 采样器: Euler A

    • 步数:50-100

    • 是的,CHAD Euler A 仍优于原版 DPM

  • 放大器: AnimeVideo v3

    • 步数:10-15

    • 去噪强度:0.45-0.55

基础模型:

  • Counterfeit V3-fp16-fix

    • 经过6个月等待,作者发布了 CFv3 的 VAE 修复版本。原版存在严重 VAE 问题,导致所有 CFv3 LoRA 均受影响,即使更换 VAE 也无法修复。强烈建议使用此修复版本。

    • 似乎是 唯一 能兼容 NAI 1.0 LoRA 的训练模型,意味着它是唯一适合微调的模型。

数据集:

  • 200 张《蔚蓝档案》官方艺术作品 + 翻转,共计 400 张。

    • 与 BArtstyle LoRA 相比,数据集已彻底重构。

    • 使用可找到的最高分辨率,并裁剪以提升数据质量

    • 使用 XnConvert 下采样至 1280x1280

训练设置:

  • 优化器: AdamW8bit

  • 调度器: 带预热的恒定学习率

    • 预热至总步数的 10%
  • UNET 学习率: 1e-6

  • TE 学习率: 1.25-7

    • 建议为 UNET 学习率的 1/8

    • 在总步数的 50% 处停止 TE 训练

  • 轮次: 100

  • 批处理大小: 1

  • 步数: 40000

  • 分辨率: 1280x1280

  • 耗时: 10小时27分钟

此模型生成的图像

未找到图像。