Willy's Noob Realism
详情
下载文件
关于此版本
模型描述
本模型及其版本合并的唯一目的是最终基于Noob打造一个出色且一致的写实模型。“HD”及更新版本专为高分辨率原始生成和放大而设计。
!!! 如果您遇到问题、噪声图像或提示词问题,请向下滚动至“常见问题” !!!
版本信息
V-Pred v1.0 - 新版!
这是Willy的Noob写实V-Pred的首个发布版。
此版本与Willy的Noob写实早期版本略有不同,因此在某些方面行为会有所不同。虽然相比之前略有风格损失,但此版本保留了高分辨率细节与写实感——更重要的是,它重新引入了整体正确的光照效果,而此前所有版本都难以处理这一点。
要将此V-Pred模型调整到我期望的状态,远比我预想的困难得多。我原以为这会是一个快速的过程,结果却花了数周时间不断实验,只为找到一种方法,让一个似乎几乎无法处理光照的模型重新拥有正确的光影效果。(作为参考,从v4到V-Pred alpha仅用了一天——此后的一切才是真正艰苦的打磨过程。)
在此过程中我了解到,风格问题和光照问题都存在于相同的权重层中,这使得修复变得棘手:要么进行一些相当粗糙的合并,要么花费大量时间深入研究每一层并进行数小时的实验。
本版本在CFG值为5-7时表现良好。较低的CFG更适合暗场景,较高的CFG则更适合明亮场景和更饱和的颜色。
V-Pred Alpha
V-Pred Alpha是Willy的Noob写实首个使用v-pred而非eps噪声预测的版本。
此版本能生成更鲜艳的颜色,整体上能更好地处理明暗对比。
作为Alpha版本,它远未达到完美。修复eps版本中的“聚光灯”问题,并重新训练出适合暗场景的正确暗光效果,所需时间远超预期,因此我决定现在发布初始版本,而不是让用户继续等待我进一步调整数据集和训练参数。
V-Pred模型通常难以与多种采样器和调度器组合兼容,因此使用此版本时您可能需要自行尝试以找到合适的组合,或回到v1.0推荐的采样设置——这些设置完全可用。
HD v4.0
HD v4.0是Willy的Noob写实“HD”系列的最新且最终版本。本版本旨在进一步提升写实度,同时强化此前丢失的知识,并进一步稳定模型。
此版本无需常规所需的质量与风格标签即可生成写实图像,且无需任何负面提示词。
下一步方向?:我的下一个目标是为Willy的Noob写实制作一个真正的v-prediction版本。
HD v3.0
本版本合并了多种改进,旨在进一步提升写实度,增加多样性和表现力。修复了植被和大多数背景,同时限制了过多噪声。
本版本已通过Euler A与Beta、DPM++ 2m SDE与Karras调度器测试,支持基于标签的提示与部分自然语言提示。 (最佳效果为纯标签,或标签与自然语言结合使用)
HD v3.0在高分辨率下稳定性提升,可稳定生成1920x1920的原始图像,在2048x2048分辨率下也基本稳定,具体取决于提示词与宽高比。提高CFG值可进一步增强2048x2048分辨率下困难提示词的稳定性。(可适当降低CFG以缓解高CFG导致的色彩过度饱和问题)
HD v2.0
本版本合并旨在提升写实度,同时解决背景噪声问题,并保留其对复杂主题与物种的理解能力,可生成高达1920x1920的原始图像,且问题极少。
使用与HD v1相同的版本特定设置。
HD v1.0
本版本旨在提升写实度,同时支持更高分辨率的原始生成,图像质量媲美放大后效果!此版本可生成从768x768到1920x1920分辨率的图像,不会出现断裂。
版本特定设置:
提示方式与其他模型相同,但为获得高分辨率图像的最高细节,建议至少使用50步生成。更多详情请参见“推荐设置”。
如生成图像中出现非预期的多个角色,请确保加入标签“solo”。
更长、更详细的提示词通常会生成更稳定且更细致的图像。
本版本中部分提示词可能不够稳定,请自行尝试调整。
v2.0
本版本使用与v1.0相同的设置,整体在写实度和放大支持方面均有提升。
v1.0
初始发布版本。
推荐设置:
TL;DR 非常简单:按您平时使用Noob的方式提示即可,但在质量标签后添加“realistic”和“photorealism”。
我建议使用Euler A搭配Beta调度器,或DPM++ 2m SDE搭配Karras调度器(不适用于V-Pred),CFG值设为5-7,步数设为20-50,但请自由尝试。并非所有调度器和设置对每个人都能正常工作。
以下是一个正面提示词示例:
<质量标签>, realistic, photorealistic, <风格标签>, <角色标签>, <姿势标签>, <背景标签>
以下是填写示例:
masterpiece, best quality, highres, absurdres, (realistic, photorealistic), 1girl, solo, anthro, wolf, grey fur, posing, bedroom
以下是推荐的负面提示词:
(生成高质量图像时已不再需要负面提示词)
worst quality, low quality, normal quality, monochrome, bad anatomy, ugly, (illustration, cartoon, anime), flat color, outline, smooth skin, blurry,
以上是我的个人推荐,但请自由尝试,使用您认为最适合的设置!
常见问题:
我的推荐设置并非绝对,仅基于我在ComfyUI中测试和使用模型时的个人偏好。
除非您明确指定性别,否则模型会因倾向女性而自动生成女性角色或有乳房的角色。
标签“1girl”在尝试生成写实人类时,可能对某些提示词产生问题。如出现异常输出,请尝试改用标签“female”。
如出现非预期的多个角色,请确保加入“solo”标签。
Forge中的Beta调度器未正确实现,会导致严重噪点与伪影。
以下是Forge中可用的调度器列表:https://civitai.com/posts/11756794
经我测试,Beta调度器在Reforge中是可用的,但部分用户报告存在问题。请您在向我反馈前,确保Reforge为最新版本。否则,大多数其他采样器在Reforge中均能正常工作。
以下是Reforge中可用的调度器列表:https://civitai.com/posts/11756585
目前尚未有使用A1111的用户报告任何问题。若您在A1111中遇到问题,建议核查您的设置。
以下是A1111中可用的调度器列表:https://civitai.com/posts/11757173
部分用户在使用Reforge时报告出现轻微VAE伪影。这可能是由于您的VAE设置不正确所致。本模型使用默认的sdxl.vae.safetensors SDXL VAE。
某些EPS LoRA可能导致V-PRED版本模型出现问题,例如EPS的“聚光灯”效应,会使夜景/暗光场景变亮,或降低色彩饱和度。
其他信息:
本模型合并时主要考虑了兽迷(furry)群体,但完全能够生成各种写实人类与类人奇幻生物。我已广泛测试其对各类独特兽迷物种、类人奇幻生物和人类的兼容性,并测试了其与SDXL、PDXL、IL、Noob LoRA的兼容性。大多数基于正确标签训练的LoRA均可与本模型兼容,但Noob LoRA效果最佳(因其为本合并模型的基础),其他基于SDXL的模型LoRA也可能有不同程度的成功表现。
“假滑块”Pony LoRA将无法使用,因为它们是基于Pony的质量标签激活训练的(这类LoRA极少,仅作提醒)。
随着更多资源发布或我有时间开发更多写实或其他LoRA,我计划未来逐步推出更好的版本,以进一步增强本模型。
如您有任何问题、反馈或建议,欢迎在评论区告知我!













