InnoVision

详情

下载文件

模型描述

InnoVision

InnoVision 是一个适用于动漫和半写实图像生成的通用基础模型。它采用多种合并与微调技术,使您能够创作出从插画风格到四分之三写实风格的各种艺术作品。该模型支持 danbooru 标签风格的提示(例如:1girl, from side),同时也支持部分自然语言风格的提示,两者结合使用效果最佳。

展示的样本图像中,90% 均在首次尝试时,使用一些常见测试提示生成,未进行任何重试,以真实反映模型性能。若您重试并采用更高级的提示策略,您的结果可能会更好。

本模型的优势在于支持 SD1.5 风格的“霰弹枪式”提示。与我发布的其他多数模型不同,它对 ADetailer/FaceFix 的依赖程度较低,但仍建议使用。模型经常能生成不错的手部效果。

控制输出风格

根据需要在正向与负向提示字段中使用以下内容:

  • anime/anime style/2d/thick lines(动漫/动漫风格/2D/粗线条)

  • realistic/realism/hyperrealism/3d/photograph/volumetric lighting(写实/写实风格/超写实/3D/照片/体积光)

某些主题在“动漫空间”中效果更佳,而另一些则在“半写实空间”中表现更好。

推荐的基础负向提示:

worst quality, low quality, deformed, bad anatomy

更高级的负向提示能带来更佳效果。

样本所用 Web-UI 设置

基本设置:
步数:30
采样器:Euler a
调度器:Automatic
CFG 缩放:9(按需调整)
Clip 跳过:1 或 2
宽 x 高:896 x 1280
未应用(也无需)高分辨率修复,但您可以尝试使用

高级设置:
Token 合并比例:0.5
Downcast alphas_cumprod:True

对于风景图,我推荐使用 DPM2 Karras,并在设置中将“img2img 和高分辨率修复的额外噪声乘数”设为 0.07 —— 在 img2img 模式下,去噪强度设为 0.4、CFG 设为 12,并根据您的硬件支持的倍率进行尺寸调整。此方法优于超分模型。

备注

由于该模型融合了动漫与写实两种特性,因此很适合作为微调至动漫、写实风格等任务的基础模型。由于模型具备丰富的概念表达能力,其生成结果可能非常出色,若您将其用于微调,请务必告知我。我个人也将用它进行微调项目,敬请期待后续模型!

本模型尚未经过明确 NSFW 内容测试,您的结果可能有所差异。

配方

将优秀的 AlbedoBase XL - v2.1 与我发布的实验性扰动模型 GloryToAllMankind - v1.0 (GTAM) 进行 0.5 直接合并。

扰动合并是我开发的一种方法,通过创建一个目标(通常为不可用、夸张的模型)来扩展与之合并模型的能力。将这两个模型合并后,提示遵循性优于单独使用任一模型。

请尝试将 GTAM 与您喜爱的其他模型进行合并!

此模型生成的图像

未找到图像。