Bad Card Template

详情

下载文件

模型描述

如果您想使用 v1.0 版本,请阅读说明(https://civitai.com/articles/671

此模型用于生成桌游/集换式卡牌的游戏卡片模板。

Loras

  • bct2_basic:生成卡片,略显过度渲染(细节过多,大量3D效果,颜色略显泛白,但整体外观尚可)

  • bct2_2080_basic:生成卡片,移除了过度渲染的检查点

提示词(Prompting)

  • 激活词 'bct2'

  • 一种颜色:'绿色', '熔岩红', '黑金配色'

  • 一种风格或艺术宇宙:'水彩风格', '蒸汽朋克油画风格', '数字艺术风格'

  • 背景描述:'黑色背景','背景中有森林','带有涂鸦的背景'

  • 卡片描述:'带有金色装饰的卡片','看起来像宝石的卡片'

  • 标题横幅描述:'蓝色标题横幅','锤纹金色文字横幅'

  • 插画描述:'椭圆形插画区域配闪电','黑色画框'

  • 文字框描述:'带有云纹纹理的文字框'

  • 属性区域描述:'左上角的心形符号','右下角的盾形符号'

  • 画质要求:'杰作,最佳质量'

  • 负面提示:模糊、画得差、丑陋、低质量(来自训练数据集)

显然,这些并非全部需要或在生成图像时都会被全部采纳,但这正是模型训练所依据的风格……

权重(Weight)

这比较难把握,因为大多数模型都会倾向于画人类或女孩形象。

  • 1.5~3.0:适用于能画风景或物体的模型

  • 2.5~4.5:适用于 Lyriel 和部分动漫风格模型(以克服其倾向于画动漫女孩的倾向)

  • 0.7~1.3:适用于 waifu 基础模型

  • 如果生成的是画作而非卡片,权重过低;若卡片细节正常,权重合适;若卡片无细节,权重过高;若卡片中央出现黑洞,则权重过高

  • 可在提示词中加入 'plain card style' 以帮助生成标准卡片(矩形卡片,标题,插画,标题,文字区域)

在任何情况下,使用新检查点时,强烈建议配合使用 Prompt X/Y/Z 并调整 Lora 权重

使用动漫模型制作卡片

此模型基于 OpenJourneyV4(写实风)进行训练。

  • 使用动漫模型制作卡片更具挑战性,因为难以精确生成卡片形状(需 Lora 权重 > 4.5,但 Lora 会在达到前就失效)

  • 决定卡片是否合格的关键似乎是随机种子而非 Lora 权重(需选择对比度高的种子)

  • 可尝试的方法:

    • 尝试多个种子,复用表现良好的种子

    • 在选定理想种子后,微调 Lora 权重

    • 参考前述方法,尝试添加 'plain card style'

    • 尝试降低 'bct2' 激活词的权重,因为这些模型使用 Booru 风格提示词而非自然语言提示,Lora 在文本层的作用可能无效

    • 另一种方法是先用 Lyriel 或 XenoEngine 生成一张卡片,再通过 img2img 用循环反馈(loopback)功能在动漫检查点上处理(示例参数:0.6 去噪强度,50 步,6 次循环反馈,0.2 最终去噪)

补充说明

  • 强烈建议使用 add_details Lora(以使卡片更具卡通感或更写实)/model/82098/add-more-details-detail-enhancer-tweaker-lora

  • 可使用 http://cleanup.pictures 清理不必要的细节

  • 可使用基于 segment-anything 的扩展工具,选择卡片中需要后期处理的部分

  • 模型有时会生成偏暗的图像(因训练数据多为黑底+黑色插画框),可通过提示词修正

  • 使用 ControlNet 生成特定卡片形状的技巧依然有效(详见 v1.0 说明)

  • 训练所用数据集已公开。若从头开始重训,我也会使用辅助词(如 'tablet'、'smartphone'、'trading card')

  • 我尝试过训练文本反转(textual inversion),但失败了(与 Lora 互动不佳)。但得到一个启发:有效辅助提示词是 '📅'(日历表情符号)。我尝试在提示中加入多个 📅,发现生成更贴合提示词,会强制产生更多图标(适合展示属性),并在卡片上形成更多细分区域

  • 更多 Lora 可见 /model/95424/pokeffects

  • 关于审美评分(aesthetic score):

    • 根据我的观察,4.5 为正常卡片,5.5~6.0 为非常美观的卡片,6.2+ 就不再是卡片,而变成画作

    • 因此,若不加入 'masterpiece, best quality',反而有助于保留卡片形状

    • 该模型是在写实检查点上训练的,可在写实模型上获得 5.56.0+ 的评分,但在动漫模型上仅能维持 5.05.5(需专门构建数据集并训练专属 Lora)

  • 关于元素布局:现代神经网络使用注意力机制(具备平移不变性,图像整体不会因上下移动一像素而明显改变),但也意味着在图像特定区域精确放置元素较困难。若需精确布局打牌或棋盘,则需要 ControlNet、SDXL/SD3 或注意力增强技术(见 ControlNet 颜色部分的文末说明)

YouTube 相关

  • 有位 YouTuber 提问:在 AI/SD 时代,桌游艺术家还如何获得报酬?/watch?v=SdgzH2OSZDY。这个 Lora 的初衷就是为艺术能力较弱者提供更好原型。如果你对这个话题有看法,请观看并留言评论

  • /watch?v=XDd4u2xnRtE 是制作 TCG 卡牌的重要规则视频

  • 我看了一个不错的 YouTube 视频,有几点评论:

    • 计算机视觉中的“遮挡问题”指部分物体被其他物体遮挡。该方法通过逐个生成卡片不同部分,避免了部分元素互相遮挡的生成问题

    • ControlNet 技巧与 bct-v1.0 类似,但“纹理遮罩潜在空间”对我是新概念。通过使用极小的点,他可能在追求超细节纹理(精细尺度细节,高频傅里叶成分)

    • 他能生成不同(可互换)的卡片部分,用于制作不同版本的卡牌(如不同家族、颜色、稀有度等),同时保持兼容性,因为所有元素均由 ControlNet 严格限定尺寸——这在我看来非常优秀

    • 他通过合成所有部分后运行一次最终的 img2img(0.25 去噪强度),且所有卡片部分均使用同一模型,以保持整体一致性

    • 对于盾牌部分,我更推荐使用 bct-v1.0 配合 ControlNet(圆形作为控制)与低 Lora 权重。bct-v1.0 Lora 具有“图像扁平化与图标化”功能,可能更适合

    • 对于最终文字与图像的合成,我更推荐使用已知的卡牌制作软件(如需重新生成整副游戏卡组),但这样就无法实现最终 img2img 的融合效果

    • 最后一点小抱怨(极度细节控):你可以让肖像成为构图中最深(最被遮挡)的部分,仅少数元素例外(本视频中,宝石与发丝可位于卷轴和画框之上)。我不确定这叫什么,也无法自动化实现

    • 终极成果令人惊叹

此模型生成的图像

未找到图像。