Willy's Noob Realism
详情
下载文件
模型描述
该模型及其版本合并的唯一目的是最终基于Noob打造一个出色且一致的写实模型。“HD”和“V-Pred”版本专为高分辨率原始生成和上采样设计。
!!! 如果您遇到问题、噪点图像或提示词问题,请向下滚动至“常见问题” !!!
版本信息
V-Pred v2.0 - 新版本!!
这是Willy的Noob写实V-Pred的第二个版本。
此版本几乎融合了旧版模型风格与新版V-Pred v1.0的特性,能够同时生成较暗场景和明亮自然光照场景,类似旧版EPS模型和V-Pred alpha的效果。
随着我持续改进模型,我发现不引发其他显著问题或在某些领域造成重要知识损失的情况下,越来越难提升模型质量。
在本版本中,我替换了clip-L,并使用我自己的及其他特定LoRA调整了模型。
此版本在CFG 4-9范围内表现良好。CFG越低,色彩越平衡,更适合暗场景;CFG越高,更适合饱和色彩和明亮场景。
V-Pred v1.0
这是Willy的Noob写实V-Pred的首个发布版。
此版本与Willy Noob写实的早期版本略有不同,因此在某些方面行为会有所不同。虽然相比之前略有风格损失,但此版本保留了高分辨率细节与真实感——更重要的是,它重新引入了整体正确的光照效果,而此前所有版本都难以处理这一点。
将V-Pred模型调整到我期望的状态,远比我预想的困难得多。我以为这会是一个快速过程,结果却花了数周时间反复试验,才找到一种方式将正确光照重新引入一个几乎无法处理光照的模型。(作为参考,从v4到V-Pred alpha仅用了一天——此后的一切才是真正艰苦的攻坚。)
我在此过程中学到的是,风格与光照问题都存在于同一组权重层中。这使得修复变得棘手,因为选择要么是进行相当粗糙的合并,要么花费大量时间深入每个层并进行数小时实验。
此版本在CFG 5-7时表现良好。较低CFG更适合暗场景,较高CFG更适合明亮场景和更饱和的色彩。
V-Pred Alpha
V-Pred Alpha是Willy Noob写实首次采用v-pred而非eps噪声预测的版本。
本版本能呈现更鲜艳的色彩,整体上对明暗场景的处理也更佳。
作为Alpha版本,它远非完美。修复eps中的“聚光灯”问题,并重新训练出适合暗场景的正确暗光效果,所花时间远超预期,因此我决定现在发布初始版本,而不是让用户继续等待我进一步调整数据集与训练设置。
V-Pred模型通常难以与大量采样器和调度器组合兼容。因此,本版本可能需要您自行尝试找到最佳组合,或回到v1.0推荐的采样设置——它们表现同样出色。
HD v4.0
HD v4.0是Willy Noob写实“HD”系列的最新且最终版本。此版本旨在进一步提升真实感,同时强化此前丢失的知识,并进一步稳定模型。
本版本无需常规所需的质量与风格标签即可生成写实图像,且不需要任何负向提示词。
下一步计划? 我的下一个目标是为Willy Noob写实开发一个真正的v-prediction版本。
HD v3.0
此版本合并旨在进一步提升真实感,增加多样性和表现力,修复植被与多数背景,并限制多余噪点。
本版本已通过Euler A与Beta、DPM++ 2m SDE与Karras调度器测试,支持基于标签的提示与部分自然语言提示。 (最推荐仅使用标签,或标签与自然语言混合使用)
HD v3.0在高分辨率下稳定性提升,可实现完全稳定的1920x1920原始生成,在2048x2048分辨率下生成时仅出现轻微至中等程度问题(具体取决于提示词与宽高比)。提高CFG可进一步提升2048x2048分辨率下问题提示词的稳定性。(可使用Skimmed CFG降低高CFG导致的过度饱和)
HD v2.0
此版本合并旨在提升真实感,同时尝试解决背景噪点问题,同时保留其对复杂主题与物种的理解能力。可生成高达1920x1920的原始图像,问题极少。
使用与HD v1相同的版本特定设置。
HD v1.0
此版本旨在提升真实感,同时支持高分辨率基础生成,质量媲美经过上采样的图像!本版本可从768x768到1920x1920分辨率生成图像,不会出现断裂。
版本特定设置:
提示方式与其他模型相同,但为获得高分辨率图像的最高细节,建议生成时至少使用50步。详情请参阅“推荐设置”。
如果您生成的图像中出现意外的多个角色,请确保加入标签“solo”。
更长、更详细的提示词通常产生更稳定且细节更丰富的图像。
某些提示词在此版本中可能不够稳定,请自行尝试调整。
v2.0
此版本使用与v1.0相同的设置,整体在真实感上有所提升,并更好地支持上采样。
v1.0
初始发布版本。
推荐设置:
TL:DR 非常简单,只需像平常一样为Noob写提示,但在质量标签后加上“realistic”和“photorealism”。
我建议使用Euler A + Beta调度器,或DPM++ 2m SDE + Karras调度器(不适用于v-pred),CFG设为5-7,步数设为20-50,当然也可以自由尝试。并非所有调度器和设置对所有人都适用。
以下是正向提示示例:
<质量标签>, realistic, photorealistic, <风格标签>, <角色标签>, <姿势标签>, <背景标签>
以下是完整示例:
masterpiece, best quality, highres, absurdres, (realistic, photorealistic), 1girl, solo, anthro, wolf, grey fur, posing, bedroom
以下是建议的负向提示:
(生成优质图像已不再需要负向提示)
worst quality, low quality, normal quality, monochrome, bad anatomy, ugly, (illustration, cartoon, anime), flat color, outline, smooth skin, blurry,
以上为我的个人建议,欢迎自行实验,使用您觉得最合适的设置!
常见问题:
我推荐的设置并非绝对,仅是我使用模型在ComfyUI中测试后的个人偏好。
除非您明确指定性别,否则模型会因偏向女性而自动生成女性角色或有胸部的角色。
标签“1girl”在生成写实人类时可能对某些提示词造成问题。如出现奇怪输出,请尝试改用标签“female”。
如出现不想要的多个角色,请确保加入标签“solo”。
Forge中Beta调度器未正确实现,会导致严重伪影和噪点图像。
以下是Forge中可用的调度器列表:https://civitai.com/posts/11756794
在我的测试中,Beta调度器在Reforge中是可行的,但部分用户仍报告问题。我建议您在向我反馈前,先确认Reforge是否为最新版本。除此之外,大多数其他采样器在Reforge中运行良好。
以下是Reforge中可用的调度器列表:https://civitai.com/posts/11756585
目前没有任何A1111用户报告问题。若您在A1111中遇到问题,建议您核对设置。
以下是A1111中可用的调度器列表:https://civitai.com/posts/11757173
部分用户在使用Reforge时出现轻微VAE伪影,这很可能是VAE设置不正确所致。本模型使用默认的sdxl.vae.safetensors SDXL VAE。
某些EPS LoRA可能影响本模型的V-PRED版本,例如EPS“聚光灯”效应,会使夜间/暗场景变亮或降低色彩饱和度。
其他信息:
该模型在合并时以兽人(furries)为设计目标,但完全能够生成各类写实人类与类人幻想生物。我已广泛测试其对多种独特兽人物种、各类类人幻想生物与人类的兼容性,并测试了其与SDXL、PDXL、IL、Noob LoRA的兼容性。大多数基于正确标签训练的LoRA均可与本模型配合使用,但Noob LoRA效果最佳(因本模型基于Noob),其他基于SDXL的模型LoRA可能以不同程度成功运行。
“Fake slider”Pony LoRA无法使用,因为它们是基于Pony的质量标签激活训练的(这类LoRA极少,仅作提醒)。
随着更多资源发布或我有时间开发更多写实或其他LoRA,我计划逐步推出此模型的更好版本。
如您遇到任何问题、反馈或建议,请在评论区告知我!














