Queratogray Sketch (eddiemauro-mix)

详情

下载文件

模型描述

使用前须知

  • 您需要了解Stable Diffusion的工作原理。我推荐使用Automatic1111作为界面来运行模型。

  • 该模型基于SD 1.5模型训练,因此请记住它并非完美。在达到稳定生成效果之前,我进行了大量测试。当出现更好的基础模型(如新的SD XL)时,我会进一步优化该模型。

  • 这是一个检查点(Checkpoint)数据集。

  • 我推荐您关注我的Instagram账号,在那里我将分享关于AI图像生成的详细讲解:https://www.instagram.com/eddiemauro.design/

简介

QUERATOGRAY SKETCH (eddiemauro-mix) 检查点:大家好,我是一名产品与汽车设计师,非常兴奋能将AI用于设计,我认为它是一个强大的设计工具。我决定与一位朋友合作,他叫Joell Martínez Tenjo,是一名专注于动画与插画的产品设计师。我们收集了他超过50张灰度/单色风格的“Sketchbook”系列插画,并以此训练模型,还融合了其他一些模型以稳定训练过程,最终成功还原了约50%的他本人风格。您可以在以下链接查看他的作品集:https://www.behance.net/queratoilustracion

该风格主要针对人物图像生成,但您可以将其与其他LoRA结合使用,以扩展至其他类型的创作。

如果您希望支持我的工作并帮助我上传更多高质量模型,请访问此处捐赠,我将非常感谢:https://ko-fi.com/eddiemauro

安装说明

  • 我使用Automatic1111——Stable Diffusion图像生成的最佳用户界面,因此我建议您本地安装,或使用Colab等在线平台运行。您可以在网上找到相关安装教程或视频。若您选择本地安装,可观看此在线教程,并建议您至少配备6–8GB显存的NVIDIA显卡,以确保界面稳定运行。请使用“Microsoft Edge”浏览器,因“Google Chrome”可能会出现兼容问题。同时建议安装“medvram”或“lowvram”选项,并配合“xformers”(可在网络上搜索具体安装方法)。

  • 使用前必须安装该检查点模型。

  • 为生成高质量图像,请务必遵循我所有的建议。若不遵守,则很难生成理想效果。此外,需要认识到当前AI图像生成尚不具备完全一致性和完美性,必须投入时间反复测试才能获得理想结果。

图像生成建议

  • 激活标记/提示词:在提示词框中,第一个词必须为 “sketch artstyle”,以激活该风格。此操作为强制要求,若未执行,效果将无法实现。

  • 推荐的提示词组合:在正向提示词中可加入以下词汇以增强生成效果:正向提示词:“grayscale, monochrome, ((solo))”;负向提示词:“out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, color”。您也可参考示例图像的元数据,尝试模仿其提示词结构。

  • 推荐使用文本反转/嵌入式LoRA工具:若希望保留原有风格,请避免使用负向嵌入(Negative Embeddings),否则风格将退化为普通灰度素描。建议使用简洁的负向提示词(参见示例图像),因为复杂的负向提示会破坏风格。该模型在生成人脸与眼睛方面表现良好,因此通常不需要“面部修复”或其他嵌入模型。若必须使用负向嵌入,我推荐使用“EasyNegative”——它是目前最有效的文本反转负向提示模型之一。下载链接,安装后将文件放入“embeddings”文件夹中。

  • VAE:生成灰度素描风格时,必须使用 "kl-f8-anime2"。如尚未安装,请立即下载并完成安装。

  • Clip Skip:请设置为2。

  • 步骤数与CFG值:推荐使用20–40步,CFG值设为7–8,理想配置为:30步,CFG=7。未来的模型可能需调整这些参数。

  • 采样器:我主要使用“EulerA”或“DPM++SDE Karras”。EulerA更简洁且更具创造性。您也可尝试其他采样器以获得不同风格。

  • 批次(Batch)设置:在txt2img模式中,建议将数值设为4,以一次生成多张图像并观察效果。若您显卡性能良好,可使用“Batch size”一次生成4张图像(生成时间较长);若计算机承受不了,建议使用“Batch count”按顺序生成4张图像,虽耗时较长,但系统更稳定。

  • 图像比例:建议使用以下尺寸:512x512,768x512,512x768。避免生成尺寸过大的图像,否则风格可能丢失。如需更大尺寸,请使用txt2img模式下的hires.fix功能、img2img的放大方法、Ultimate SD Upscale脚本扩展+ControlNet,或直接使用GAN类模型进行超分。

  • 生成大尺寸图像:Stable Diffusion提供四种生成大图的方法,可在线查找教程。第一种方法“txt2img hires.fix”中,我推荐使用名为“4x-AnimeSharp”的放大模型,下载地址 仅需下载“.pth”文件,放入“ESRGAN”文件夹中。在hires.fix中选择任意“放大倍数”,并设置“去噪强度”为“0.5–0.7”。第二种方法是先在txt2img中生成图像,再切换至img2img模式,将尺寸至少放大1.5倍,并将去噪强度设为“0.3–0.5”。第三种方法可沿用img2img配置,开启ControlNet扩展的“tile”模式,并启用“Ultimate SD Upscale”脚本,但建议观看此教程。第四种方法是将txt2img生成的图像导入“Extras”模块,选择一个GAN模型并进行放大,您也可使用“4x-UltraSharp”模型。

  • 提升创作控制力:建议使用“ControlNet”扩展,从而更精准地控制图像形态,甚至可以尝试用草图作为引导。可使用“Scribble”或“Lineart”模式。建议安装该扩展并学习使用方法,网络上有大量相关教程。

  • 复制提示词至图像元数据:您可下载我的示例图像,将其中的PNG信息直接粘贴至Automatic1111的“PNG info”标签页中。

示例提示词

正向提示词:
A young man, sketch artstyle, grayscale, monochrome, ((solo))

(风格丢失示例)正向提示词:
A young man, sketch artstyle, grayscale, monochrome, ((solo)), ((masterpiece)), HDR, highly detailed, professional

负向提示词:
out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, color

(风格丢失示例)负向提示词:
EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), out of frame, multiple people, missing fingers, extra digit, fewer digits, (((many people))), blurry, color

步骤数:20–40(EulerA仅需20步即可,也可尝试DPM++SDE Karras,但EulerA通常效果更佳)

CFG 值:7–8(7为理想值)

未来规划

我正在持续优化该模型。目前训练基于512×512图像尺寸,未来我将尝试使用768×768(更大尺寸)及其他配置(如调整提示词、步数、训练轮数等)。若您希望获得更优版本,欢迎持续通过Ko-fi支持我。若支持者更多,我就能投入更长时间训练与优化模型;否则,受限于时间和资源,难以推进。

我已为我的Ko-fi会员等级1推出了首个私有模型,名为“eddiemauro scene”,专注于极简场景渲染创作。若您希望访问私有模型,欢迎支持我并订阅此会员。未来我还将在此上传更多专注于产品与汽车设计的模型。

许可协议

请查看Stable Diffusion 许可证链接。本模型仅限实验用途,禁止:

  • 未经许可将此模型上传至任何服务器或公共在线平台。

  • 未经许可在线分享此模型,无论是以不同名称发布,还是上传后在商用图像生成服务中使用。

  • 与检查点或LoRA模型合并后发布或共享,使用前请先与我联系。未来:

  • 禁止出售本模型或基于其合并的模型。

支持我

您可通过社交媒体关注我,我将分享创作流程、设计技巧与工具。您也可访问我的网页,若需设计服务,我提供自由职业设计合作。

http://eddiemauro.design/

https://www.facebook.com/eddiemauro.design

https://www.instagram.com/eddiemauro.design

https://www.linkedin.com/in/eddiemauro

https://www.behance.net/eadesign1

此模型生成的图像

未找到图像。