Caricatures style TDXL

详情

模型描述

此适配器专为与 Think Diffusion XL 配合使用而训练。

((高权重 & 低 alpha,no= ~0.018,clip skip:1,BRS=64,时间步设置为 100% 噪声(不适用于 Img2Img,我正计划发布一个 Img2Img 版本),仅限 SDXL;优化用于 1024 x 1024、640 x 1536、768 x 1344、832 x 1216 和 896 x 1152。))

推荐设置

采样器:Euler A,步数:15 至 30,最佳范围为 18 至 22。

CFG:此适配器具有多重维度,因此其效果应优于默认权重,应减少对模型本身的依赖,而提高分类器引导强度,建议高于 15。CFG 设为 18 至 21 时效果极佳,部分高于 21 的结果更优异,但仅限于极少数特定情况,这些情况可视为微调且缺乏灵活性。

去噪强度(仅限 Img2Img):低于 0.85 常常会使面部变成雕塑状,0.85 能在多种 LoRA 强度下产生更逼真的效果。

LoRA 强度:建议不低于 1,1.15 至 1.25 效果良好。

经测试并确认效果良好的内容:

正向提示词:“漫画风格,单人,肖像,简洁背景,注视观众,写实,衬衫,单色,灰度,白色背景,素描,上半身,签名,鼻子,有领衬衫,传统媒介,夹克,白衬衫,浓眉,正式,讽刺,艺术家名字”

(移除“讽刺”或“写实”将改变输出结果;将“签名”和“艺术家名字”移至负向提示词中,应可去除签名——这些是本风格的特征,但我更偏好保留它们)

效果良好的面部特征:闭嘴、微笑、嘴唇、牙齿、黑眼睛、棕眼睛、张嘴、咧嘴笑

性别相关:男性焦点、1个男孩、1个女孩、女性焦点、珠宝、阳刚、女性焦点

年龄:老男人、年老、皱纹皮肤、年轻、儿童

头发:胡须、胡子、短发、长发、胡须

“漫画风格的 null,null2,单人,肖像,简洁背景,注视观众,写实,衬衫,单色,灰度,白色背景,素描,上半身,签名,鼻子,有领衬衫,传统媒介,夹克,白衬衫,浓眉,正式,讽刺”——曾用于大量测试

良好的负向提示词:照片、写实描绘、细腻表现、自然主义呈现、真实再现、逼真渲染、非夸张表现、事实性描绘、字面性描绘、精确肖像、抽象艺术、印象派、现实主义、极简主义、超现实主义、立体主义、点彩派、超写实主义、照片级写实、水印

Img2Img 模型:((高权重 & 低 alpha,no= ~0.018,clip skip:1,BRS=64,时间步设置为 300 最小值/700 最大值噪声,原计划单独发布,但因大量研究数据丢失,现与原版一同发布,仅限 SDXL;优化用于 1024 x 1024、640 x 1536、768 x 1344、832 x 1216 和 896 x 1152。))

将原图作为背景色产生光晕是常见现象,且被视为本风格的特征之一,尽管我尚未完全优化它;你可以移除背景来避免此现象。显而易见,当 CFG 值如此高时,若模型熟悉人物,输出效果会更好,因此名人图像的 Img2Img 效果通常优于家庭照片。ControlNet 可能提升效果,但我尚未测试,因 VAE 问题导致数日研究数据失效。

常见错误:“Caricature style” 与 “Caricatures style”——两者皆可使用,但建议使用带 “s” 的版本。

Img2Img 图像选择:无关紧要。我曾用 Stable Diffusion 生成的一张名人肖像,并在同一模型下成功应用于其他 15 人。Img2Img 版本与 ControlNet 非常相似。若你能用更低的去噪强度实现效果,情况可能相反,但我的测试中并不喜欢低去噪效果。

我还想说明,这是我时隔很久发布的首个 LoRA,它不用于复制真人或生成色情内容。当然,如果你的检查点是基于这类内容训练的,你或许能用它生成一些有趣的东西。今年四月,我的数十个原创 LoRA 被删除,当时我决定不再公开后续作品,但我也乐于贡献。我不理解名人 LoRA 为何有争议——有些被允许,有些却被禁止。无论如何,我很高兴我们拥有这些。

此 LoRA 并未针对任何特定人物进行训练,而是训练于漫画与讽刺艺术风格,这实际上相当复杂,而我自己根本无法绘制这类作品——这正是我开发它的原因,希望每个人都能复现出不错的成果,你务必保存好你最满意的随机种子!

此外,我还有 B 版和 C 版,如果你需要,我可以发布;据我经验,它们非常相似,我不想发布六个相似版本的 LoRA。

此模型生成的图像

未找到图像。