AutoChar - Easy character art creation with face auto-inpaint
详情
下载文件
关于此版本
模型描述
AutoChar 是由 Automatic1111(1.6.0+)开发的 Stable Diffusion WebUI 的自定义脚本,旨在帮助初学者和爱好者以更少的努力获得出色的作品。本质上,它自动化了我用于插画的基本 SD 工作流程(查看示例:https://t.me/dreamforge_tg)
GitHub 页面:
https://github.com/alexv0iceh/AutoChar
请查看我在 YouTube 上的新指南,其中详细解释了所有基本功能和流程:
如需了解脚本基本思路的文字说明,请查看 0.9 版本标签。
安装
只需将脚本和 .onnx 人脸识别模型放入你的 stable-diffusion-webui/scripts 文件夹中
请勿尝试通过 URL 安装,这不是扩展程序,这样安装将无法显示!
同时,我强烈建议下载 4x-UltraSharp 超分器(https://mega.nz/folder/qZRBmaIY#nIG8KyWFcGNTuMX_XNbJ_g),并将其放入 /models/ESRGAN 文件夹中
简要使用方法
进入你的 txt2img 标签页
编写提示词,按常规选择基本参数(无需启用高分辨率修复,因为它已包含在算法中)
在页面底部的“Scripts”下拉菜单中选择 “AutoChar 0.9.5”
点击“生成”并享受成果
0.9.5 更新内容:
完全重构的界面:
为所有关键参数添加了说明信息,包含使用技巧和非显而易见功能的解释
超分器选择从复选框改为下拉菜单,以减少干扰
功能和滑块分组为带有清晰标题的不同区块
真正的 img2img 模式:使用 SD 超分和自动人脸与眼睛修复编辑现有图像
新增高级选项!
全新极度高级选项标签页,专为希望完全掌控 AutoChar 生成流程并最大化创意的爱好者设计
多项修复:
修复了 inpaint 步骤中 OpenCV 的著名 bug (如果你仍遇到此问题,请重新下载压缩包,我已修改代码,这已帮助许多用户!)
修复了仅对遮罩区域进行填充的问题,显著提升了某些艺术风格和检查点的效果
修复了高分辨率修复超分器列表,现在能正常显示所有可用的超分器
样式菜单中的样式现已正常工作
修复了代码逻辑和参数中的诸多小问题
高级与极度高级选项的详细说明及使用建议:
高级选项:
质量功能:
滤波功能:在高分辨率修复后锐化并应用去噪滤镜以提升画质并减少所需的 img2img 步骤。可能对“噪点”或模糊的艺术风格产生负面影响。默认开启
仅对图像中最大的人脸进行修复:顾名思义,有助于防止对背景或身体部位进行误检测和修复。在角色头部较小的图像(如全身图或风景图)中可能导致问题。此时,请提高人脸识别最低置信度或禁用此选项。对于包含两个或以上角色的图像,请禁用此功能。默认开启
降低人脸修复时的 LoRA 强度。有助于避免强 LoRA 导致的过度强化:顾名思义。默认开启
使用 DDIM 采样器以获得更好的修复效果。否则将使用界面中选择的采样器:更适合细节丰富的人脸。注意:从 SD WebUI 1.6.0+ 版本开始,DPM++ 采样器的去噪强度计算方式不同,如果你因遮罩残留问题禁用此选项,请考虑增加修复步骤的去噪强度。默认开启
降低人脸修复时的 CFG:顾名思义。默认关闭
算法修改功能:
扩大人脸修复区域以同时修复头发:顾名思义。这可能大幅增加 VRAM 使用,如遇问题请降低人脸修复缩放比例。默认关闭
在头发修复后进行人脸修复:顾名思义。默认关闭
尝试使用所选选项进行中间超分修复:顾名思义。有助于添加额外细节。默认关闭
使用纯图像到图像而非 SD 超分:顾名思义。默认关闭
不使用 SD 超分,仅修复高分辨率修复结果。适合弱 GPU:除上述原因外,对习惯仅使用高分辨率修复流程的用户也很有用。默认关闭
调节每一步的去噪强度:
- 所有必要信息已在 UI 中提供,但我想补充:从 SD WebUI 1.6.0+ 开始,DPM++ 采样器所需的去噪强度约为 DDIM 去噪强度的两倍,直到 0.5;例如:DDIM 的 0.2 约等于 DPM++ 2M Karras 的 0.4
参数滑块:
高分辨率修复缩放比例:所有信息已在 UI 中提供
滤波强度:滤波功能的效果强度。0.3–0.5 效果最佳,更高值较难控制,但对某些艺术风格可能有帮助
LoRA 强度降低倍数:顾名思义。如希望保留更多 LoRA 的艺术风格,可提高此值
人脸识别最低置信度:提高以获得更严格的人脸检测,降低以改善动漫风格图像的识别效果
极度高级选项:
SD 超分的图块重叠参数、人脸修复的缩放比例、眼睛修复的缩放比例:所有信息已在 UI 中提供
算法步骤设置:
检查点:允许你为当前步骤选择不同的检查点。非常适合混合艺术风格并结合各检查点的最佳特性!
采样器:显而易见
Clip Skip:我的用例是在 Clip Skip 2 下生成基础图像,但在后续步骤中使用 Clip Skip 1 以获得更真实的效果
步骤数:显而易见
提示词与负面提示词:允许你为每一步使用不同的提示词和 LoRA。例如:在早期步骤使用物体或内容 LoRA,之后移除它们,改用风格优秀但若在 txt2img 中使用会负面影响图像内容的 LoRA
即将在 1.0 版本中推出:
作为完整扩展发布
集成 ControlNet
更多人脸识别模型(包括支持动漫风格的模型)




