VilStyle

详情

下载文件

模型描述

这个LoRA专为我的朋友Vil训练,旨在复现他们经常喜爱的高一致性且可爱的Q版动漫艺术风格,并将其融入SDXL生态系统,为其个人使用提供灵活且经济高效的生成方案。

这是一个纯粹的风格LoRAtext_encoder_lr = 0),意味着它主要影响UNet的视觉输出,不会引入新的角色概念或具体元素,仅体现其艺术风格。它设计得高度通用,可将独特的风格应用于您描述的广泛主题与构图中。

--- 使用说明 ---

激活方式: 要激活该风格,请使用以下触发词:chibivilstyle

推荐设置:

  • LoRA权重: 通常在 1.0 时表现最佳。可尝试调整,以获得与基础模型的理想融合效果。

  • 模型: Illustrious-XL(由于架构基本相同,也可能适用于NoobAI)

  • 采样设置:

    • 采样器: Euler A CFG ++
    • 步数: 20步
    • CFG比例: 1.4–1.7

--- 风格描述 ---

该LoRA的独特风格特征如下:

  • Q版美学: 角色以极具吸引力的超级变形(Q版)风格呈现,身体简化的解剖结构,通常拥有较小的身躯和比例较大的头部。

  • 富有表现力的眼睛: 大而明亮、极具表现力的眼睛是其标志性特征,仅用极少细节即可传达丰富情感,常带有明显的高光。

  • 干净的线条勾勒: 粗犷、清晰且一致的线条定义了角色与物体,赋予图像精致、插画感的视觉效果。

  • 鲜艳柔和的色彩: 采用令人愉悦的鲜艳(常为粉彩)色调与柔和阴影的结合,营造出整体欢快、温和的氛围。

  • 简化细节: 头发、服饰等元素经过风格化与简化处理,聚焦于基本形态,同时保留角色识别度。

  • 可爱魅力: 整体印象是压倒性的可爱与魅力,非常适合绘制可爱的角色插画与富有情感的肖像。

--- 训练细节 ---

该LoRA基于精心筛选的图像数据集训练,以捕捉所需的艺术风格,使用Kohya SS GUI工具,参数如下:

  • 引擎: kohya
  • 分辨率: 1024x1024(启用 enable_bucket 以实现最佳缩放)
  • 网络秩(维度): 32
  • 网络Alpha: 32(与维度匹配,实现最优权重分布)
  • 优化器: AdamW8Bit
  • UNet学习率: 5e-4(5×10⁻⁴)
  • 文本编码器学习率: 0(确保纯风格训练)
  • 学习率调度器: cosine_with_restarts(3个周期)
  • 高级设置: 启用 min_snr_gamma = 20 以提升训练稳定性与输出质量
  • 批量大小: 4
  • 最大训练轮数: 30
  • 保留令牌: 1(若使用,表示初始触发词)
  • 打乱描述: True(有助于正则化)

此模型生成的图像

未找到图像。