NextPhoto
详情
下载文件
关于此版本
模型描述
注意: 该模型自带VAE,并已集成到模型中。为获得最佳效果,请确保在automatic1111中选择的VAE设置为“自动”。如果您从未修改过VAE设置,那么这将是默认选项。
NextPhoto 是经过大量训练、数据筛选和区块合并的结果。该模型专为生成逼真照片而设计,因此无法生成非照片类图像(即使被提示也是如此)。关于v3.0版本的更多详情,请查看“关于此版本”部分。
所有示例图像均使用 ESRGAN_4x 放大模型,以2倍放大、0.45去噪强度生成。我不会上传32位模型,因为v3版本是使用16位精度训练的,上传32位模型只会浪费空间。
使用指南
(强烈推荐) 负面提示对实现逼真度非常重要,但您几乎无需更改它即可获得极佳效果。我建议以以下负面提示为基础:
(worst quality:0.8), cartoon, halftone print, burlap, (cinematic:1.2), (verybadimagenegative_v1.3:0.3), (surreal:0.8), (modernism:0.8), (art deco:0.8), (art nouveau:0.8)此提示使用了 verybadimagenegative_v1.3 文本嵌入。您需要下载:
将下载的文件放入SD WebUI根目录的“embeddings”文件夹中,然后重启Stable Diffusion。
正面提示: 您无需花费太多心思在正面提示上——该模型对简单的正面提示表现非常好。
示例:
一位女性在火车站的明亮摄影照片
一对老夫妻坐在门廊上的完美明亮中等尺寸照片
一名男子在夜晚小径上行走的昏暗照片
如需更多正面提示示例,可参考该模型的示例图片。
放大: 该模型在不进行放大时也能生成逼真的图像,但为了达到理想的逼真效果,强烈建议使用放大。在高分辨率修复(hires fix)部分,需使用 ESRGAN_4x 放大模型(非 R-ESRGAN)以获得良好效果。建议将权重设置在0.3至0.5之间,放大倍数设为2。我通常将权重设为0.5或0.45。
采样器: 我使用 DPM++ 2M Karas,通常不会尝试其他采样器。虽然其他采样器也能产生不错的成果,但在我使用该模型的经验中,DPM++ 2M Karas 的表现最为稳定一致。
进一步优化建议:
降低您的CFG值: 默认的无分类器引导(CFG)尺度为7,效果良好,但偶尔可能偏高。请逐步降低CFG值直到您满意为止——我通常最低会降到4.0,因为低于此值后负面提示会被忽略。将CFG值提高到7或8以上会导致照片变得“戏剧化”(并非良性),但也会使模型更听从提示,因此需根据情况权衡。高CFG值在特定场景下可能适用,但较低的CFG值通常表现非常稳定且效果出色。
避免过度使用LORA和文本反转(Textual Inversion): 由于v2和v3版本的本模型是经过自定义训练而非单纯区块合并,因此LORA或文本反转的效果可能不如在其他模型中那样理想。根据我的经验,虽然仍可获得不错结果,但仍建议谨慎使用——我推荐采用选择性添加的“叠加”方式,仅在必要时引入LORA或文本反转。














