Astaroth

详情

下载文件

模型描述

版本2

我将Astaroth设计为半写实风格模型。然而,当我查看输出结果时,感觉它仍不完整。因此,我尝试使其更接近真实照片,这就是版本2。

提示一致性略有提升。构图和姿态的动态感略有降低。身体稳定性和手指表现可能略有下降。部分图像在向摄影绘画风格推进时产生了过度效果。根据图片情况,建议在负面提示中添加“油性皮肤”。

所有示例图像均使用LCM以512 x 768像素输出,未使用HiRes.Fix或Adetailer。请注意,这是我为展示模型而特意采用的设置,实际上使用这些工具效果会更好。这也是SD1.5模型固有的问题。如果你使用放大器,我推荐使用基于ESRGAN、去噪强度低于0.3的模型(例如0.18。我曾经大量使用0.09)。原则上,Latent系统更符合生成模型的特性,但性能表现似乎较差。此外,在非Latent方法中,生成模型本身不被引用,而是使用内置放大器的模型对输出图像进行放大,因此若使用过高强度,可能导致任何模型都生成相似图像。当然,有些模型是基于这种假设进行调整的,但本次并非如此,因此使用本模型时,请务必保持较低强度。


版本1

很难解释这个模型的本质。简单来说,它是两年前我创建并存放在仓库中的一款名为 basilisk.fp16.safetensors 模型的修改版,原本是一次失败的尝试,基于过时的配方。

由于它基于更早期的配方,图像质量(低分辨率、模糊)和基本结构(如身体构造)存在诸多问题。为解决这些问题,我使用NAI2强化了核心结构,全面提升了照片表达与内容,并结合我近期创建的高分辨率LoRA模型,最终形成了这个版本。有人可能会说,原始模型已无关紧要。

在使用NAI2的写实模型方面,我曾尝试过几种基于Beyond的方法,但将动漫模型合并到高层时,往往会降低人物年龄,这使得在CIVITAI上发布变得困难,因此被搁置了。也有一些使用他人写实模型的版本在提升效果上表现不错,但它们在高分辨率显示时存在缺陷(虽然在标准分辨率下表现良好),处境微妙。

尽管本模型支持高分辨率显示,但我并不推荐使用。它生成的图像普遍乏味。此外,它具有一套相当独特的特征,根据提示词,有时甚至完全无法生成图像。从创作者角度来看,结果尚可接受,但令人惊讶的是,其身体结构相对清晰(尽管有时会断裂),手指表现也相当真实,这令人费解。

最推荐的采样器是DPM++SDE。虽然我通常使用20步,但要实现摄影级写实效果,DPM++SDE需使用24步。CFG尺度建议为7-6。该采样器能提供最稳定的躯体结构。

使用Euler a时,20步即可获得摄影表现,但整体偏半写实风格,且在中距离人脸等细节上,不如DPM++SDE的可再现性。DPM++SDE的构图更稳定,但略显单调,因此尝试Euler a也值得考虑。

对于摄影级表现,DPM++3MSDE更优,但CFG尺度需降至约3.5,步数约28步。

DDIM也能产生相当好的结果。在细节稳定性上略逊于DPM++SDE,但在构图及其他方面的表现力处于高水平。步数为30,CFG尺度约为5.5?

大部分功能测试均使用LCM进行,虽然手指再现略有不足,但仅用7步即可生成足够可用的图像。

所有采样器整体上可能仍保留轻微的半写实风格。

示例图像均为512×768像素的低分辨率输出(这是我近期的标准)。未使用HiRes.Fix或Adetailer。为谨慎起见,CIVITAI上使用了负面提示,但非必需。

请注意,Astaroth是一位手持毒蛇的天使(恶魔)。关于 basilisk 的故事要长得多,但那将是另一个话题了。

此模型生成的图像

未找到图像。