SPYBG's Toolkit for Digital Artists
详情
下载文件
关于此版本
模型描述
SPYBG 的数字艺术家工具包
官方 YouTube 频道: [点击此处]
Patreon: [点击此处]
最新视频:
大家好,我是来自保加利亚 AI 艺术社区的 Valentin,大家通常叫我 SPYBG,我是一名职业 3D 角色艺术家,已经从事这个行业多年了。如果你对我的专业工作感兴趣,可以在这里找到我的 ArtStation 页面:https://www.artstation.com/spybg
当我最初接触到 AI 时,和许多人一样进行了实验。我想创造一些能帮助我在个人项目中提升创造力的东西,后来我发现我所开发的工具在专业环境中也具有巨大潜力。因此,过去两个月里,我一直在为角色创建定制数据集。之后,一位在某工作室担任技术主管的亲密朋友向我提出请求,让我也制作一个环境数据集,用于我的自定义模型。
由于我了解到许多艺术家对“他人使用他们的作品”感到不满,所以我选择了不同的方向。我所有的数据集(为训练所创建的图像)都是我自己制作的,耗时颇多。但我也很聪明地使用了 AI 工具来生成我需要的内容,因此我所有的数据集(角色和环境)均完全由 AI 生成,没有使用任何其他艺术家的输入,仅包含了我自己的创作。
我的模型在 100 步内完成训练,总共训练了 194,000 步。(是的,我知道这数字看起来很多,但结果自己会说话。)
- 角色数据集:766 张由我亲自制作的图像
- 环境数据集:1160 张由我亲自制作的图像
特别感谢 Suspirior!他为我提供了不少技巧和灵感,还第一个对我模型进行了内测,非常感谢你,兄弟!我也会在这里分享他的一些测试成果。
使用我模型的建议:
我推荐使用以下设置,至少对我而言效果最佳。当然,你也可以自由尝试。
采样器: DPM++2M Karras
步骤数: 150 步(较少的步骤也能工作,但根据我的测试,150 步对这套训练数据表现最佳)
推荐分辨率: 768x768(我用于训练的基础模型是经过自定义修改的 Protogen 3.4 模型,融合了我工具包旧版本 v2.0 的元素,基于此我使用 768x768 的数据集训练了我的模型,因此我建议使用 768x768 或 768x1280,或更高分辨率)
注意:从版本 4.0 起,我使用的是基础的 1-5-pruned 模型,并对其进行了充分微调。
CFG Scale: 5 到 7 之间效果最佳
触发词: tk-char(用于角色) tk-env(用于环境)
为什么用 “tk”?(tk 代表 Toolkit)
重要提示: 若你希望在创建角色时获得最佳效果,请在 img2img 中使用我提供的模板图像,以获得更干净、更专业的图像。虽然 txt2img 在环境中表现优秀,但在角色创作上有时难以预测,而角色概念图需要高度一致性。因此,我强烈建议你使用我的模板图像,或你自己的图像。这也是我提供多种角色设定图的初衷,以帮助你获得更稳定一致的结果。
示例提示词:
角色示例:
“一张 ((male)) 的 tk-char 战士照片,高度细致,获奖级图像,16k”
或
“一张 ((male)) 的 tk-char 风格战士照片,高度细致,获奖级图像,16k”
“一张 ((female)) 的 tk-char 战士照片,高度细致,获奖级图像,16k”
或
“一张 ((female)) 的 tk-char 风格战士照片,高度细致,获奖级图像,16k”
虽然你可以单独使用 "tk-char" 作为触发词,也可以使用 "tk-char style"。请两者都尝试一下,看看哪种效果更好。
注意:在使用 tk-char 前,请加上 (((male))) 或 (((female))),以明确你想要的角色性别。之后你可以自由添加任何词语来更好地描述你的构思。此外,请保持提示词简短。虽然更长的提示词可能听起来很酷,但请参考我提供的图像模板,你会发现只需少量描述就能获得不错的效果。
此外,这里提供我部分“演示图”的链接,你可以将这些图像用作 img2img 的模板,或使用你自己的图像。但若你用于角色概念创作,我的图像能带来良好效果(提供两个版本:基础全身图,不同比例和轮廓,1:1 长宽比;以及头部细节特写图,2:1 长宽比)。
模板图像链接: [下载]
环境示例:
“一张 tk-env 古代风格环境的照片,波斯城市,人群中行走,古波斯时代场景,城市中有棕榈树,各处遍布花朵,获奖级图像,高度细致”
只需在提示词中加入 tk-env 即可激活训练数据。
我建议添加负面提示以获得最佳效果,任何负向提示都可行,这里是我使用的版本:
负面提示: (((signature))), (((text))), (((watermarks))), 变形的眼睛, 特写镜头, ((disfigured)), ((bad art)), ((deformed)), ((extra limbs)), (((duplicate))), ((morbid)), ((mutilated)), 超出画面, 多余手指, 变异的手, 画得差的眼睛, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), ((ugly)), 模糊, ((bad anatomy)), (((bad proportions))), 复制的面孔, 身体超出画面, 超出画面, 解剖结构错误, 比例失调, (畸形的肢体), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), (融合的手指), (手指过多), (((长脖子))), 图案重复, 画得差, 变异, 斜视, 画布框, 相框, 卡通, 3D, 奇怪的颜色, 模糊
注意:在最新版本 v4.5 中,你无需使用任何负面提示,没错,你没听错!但如果你仍想添加,上述内容可作为良好起点。
VAE: 我推荐使用 Stable Diffusion 的基础 SD 1.5 VAE 以获得更佳效果。
SD 放大 & Ultimate SD 放大: 如果你想放大生成的图像,我推荐使用 automatic1111 SD 放大,设置为 0.35(噪声强度),放大比例为 2,并使用 R-ESRGAN General 4xV3 进行放大。这种方式对我而言效果最佳。
由于我的模型基于 SD 1.5,任何使用 SD 1.5 模型训练的嵌入(Embedding)都能与我的自定义模型良好兼容。我将在下方附上一些精选的优秀嵌入链接,并在后续持续更新列表。
嵌入模型:
[SPYBGTK-C-Enh] - 我自行设计的工具,用于进一步提升角色创作效果,可与我的模型配合使用
注意:请适当降低 LORA 嵌入的权重强度,以便修复模型中部分问题,但不会完全覆盖你原本的设计意图。
[CharTurner] - 非常适合从正面和背面视角生成角色概念图(建议搭配我的模板图像中的 (Front_Side_Back) 图使用,效果更佳!
注意:目前我的模型已在 txt2img 中支持同一角色的多视角生成,不过仍建议安装此插件,实用又强大!
欢迎你自由使用、合并、探索我的模型,用于任何你想尝试的内容。
如果你使用了本模型并想署名感谢我,完全没问题。但我不在意,我唯一希望的是,能让更多人和艺术家拥有一种可用于生产流程、或仅用于趣味实验的工具。
这是我目前能做到的最接近理想状态了。
是的,你也可以用这个模型训练你自己的图像,无论是你自己还是其他任何内容。
但为了获得更优的额外效果,我仍建议你为自己的图像创建 TI 嵌入。
P.S. 欢迎分享你的创作成果!我很期待看到你们的作品!
干杯!
你身边的朋友 3D 角色艺术家
Valentin

















