d3caricature
详情
下载文件
关于此版本
模型描述
你是否想创建具有大耳朵、低额头、突出鼻子和夸张面部表情的角色?没错,d3caricature 就是为了实现这一目标而生!
这是我首次尝试为 Stable Diffusion 创建嵌入(Textual Inversion 永垂不朽!),在过去一个月左右的陡峭学习曲线中,这就是最终成果。
该嵌入适用于“原版”Stable Diffusion 2.1 768,同时也兼容众多其他 2.1 模型。它对动物影响很小(几乎无影响),仅针对人物,且在许多情况下会产生非常极端的效果。
因此,我提供了该嵌入的三个版本:
d3caricature-beta-x —— 一个均匀分布的单向量版本(影响最小)
d3caricature-beta-y —— 一个六向量“半权重”均匀分布版本(中等影响)
d3caricature-beta-z —— 一个六向量全权重均匀分布版本(高影响)
你可以尝试将它们置于提示词的开头、中间或结尾,调整权重高低,或使用更高的/更低的 CFG 值进行实验。
这些版本已在 stable-diffusion-2.1-768 上经过充分测试,但我强烈建议你将其与其它 2.1 模型配合使用,例如 perpetualDiffusion10_v10Moon(及 sun)和 illuminatiDiffusionV1_v11。
所有嵌入版本均基于同一训练集——68 张精心挑选并微调的图像,训练过程如下:
- 500 步 @ 学习率 0.375-0.5(带预热的线性衰减)
- 1000 步 @ 学习率 0.075-0.1(带预热的线性衰减)
- 1000 步 @ 学习率 0.015-0.02(带预热的线性衰减)
- 2000 步 @ 学习率 0.003-0.004(线性)
- 2500 步 @ 学习率 0.0006-0.0008(线性)
- 2500 步 @ 学习率 0.00016
所有训练均在 invokeai 2.3.5 中使用 4 个 gradient_accumulation_steps 完成,之后使用 a1111 的 Embedding Inspector 扩展进行整合。
我真的希望你发现这个嵌入很有用,并能从中获得无穷乐趣!目前该嵌入仍处于 beta 阶段,但我完全不知道它是否能进入“候选发布”阶段,也从未期待过它会如此。
我只是因为有一个挥之不去的想法,必须将它实现出来而已;)
感谢你的支持,尽情享受吧!
满心爱意






