YARI (Yet Another Realistic Illustrious ᵐᵒᵈᵉˡ) | Full fine tune based on WAI-NSFW

详情

模型描述

我真没想到还得说这个,但模型需要Danbooru风格的提示词!它基于Illustrious,如果你不使用Danbooru提示词,将会得到糟糕的结果!

v3.0 现已发布!本次更新带来了以下改进:

  • 本版本融合了v2.5的细节与真实感增强,同时保留了v2.0的多样性。

v3.0 花费了较长时间,因为我尝试让它真正达到照片级真实感,但老实说,虽然这确实可行,却会导致模型过于僵硬。我的意思是,它首先无法正确还原角色,比如你尝试生成《火影忍者》中的小樱时,最终只会得到一个粉发女孩,但她的脸完全不像小樱。此外,提示词遵循性也会下降。这两种症状在其他较写实的模型中也能看到(当然,我特指基于Illustrious的模型)。

我决定让我的模型在尽可能真实的同时仍保持灵活性,因此它仍能准确还原Danbooru上200条以上标签的角色,并且依然足够灵活,可以生成多角色、奇怪姿势等场景。

享受v3.0吧! :)

一个小技巧,有时能提升角色相似度:

如果Danbooru上某个角色的标签带有括号,你应该在第一个和最后一个括号前加上反斜杠。例如:“raven_(dc)” 应改为 “raven_\(dc\)”。


本模型的目的是将所有角色内置到 WAI-NSFW 中(完全致敬 WAI0731 创建的这个惊人模型),同时拥有更真实的效果。

!!! 重要提示 !!!

由于这是微调,而非合并,现有的LoRA将无法与此模型兼容。可能有部分LoRA能工作,但绝大多数不行。

我已测试并确认与本模型配合良好的热门LoRA:ExpressiveHDetail Tweaker XL

以下建议适用于所有版本:

推荐设置:

步数:15-30

CFG缩放:5-7

采样器:Euler

原始尺寸请使用大于 1024x1024 的分辨率

推荐超分设置:

高分辨率放大:1.5

高分辨率步数:20

去噪强度:0.35~0.5

高分辨率放大器:2xNomosUni_span_multijpg_ldl(我测试了多种超分器,这个在生成更真实图像时效果相当好,且速度很快)

所有预览图均附带工作流,可自动为你计算1.5倍分辨率,无需每次更改分辨率时手动调整多个参数。

所有组件(VAE、文本编码器、UNet)均已整合至检查点中。

推荐提示词:

正向提示词

photorealistic, photograph, realistic, masterpiece, best quality, amazing quality, absurdres, detailed_skin

负向提示词

bad quality, worst quality, worst detail, sketch, censor, watermark, signature, text, multiple_poses, multiple_scenes, speech_bubble, patreon_username, multiple_images, multiple_angles, bad_hands, wrong_hand, bad_anatomy, extra_fingers, extra_digits 

基本上,WAI-NSFW模型中的所有角色在这里也能使用,你可以在此查看所有可用角色:https://huggingface.co/spaces/flagrantia/character_select_saa

当然,由于是完整微调,部分角色可能已无法生成,但根据我的测试,我尝试的所有角色都能正常工作。

旧版本更新日志:

v2.0 现已发布!本次更新带来以下改进:

  • 所有输出的稳定性和提示词遵循性略有增强

  • 数据集扩大,训练数据量约为v1.0的3倍,有助于提升结果多样性

  • 1536px训练,比以前版本生成更多细节

  • 面部表情优化:以前版本中,微笑、撇嘴等表情常显得诡异,现已基本解决,所有面部表情效果更好(仍可能出错,但概率大幅降低)

v1.0 现已发布!本次更新带来显著改进:

  • 所有输出的稳定性和真实感增强

  • 减少了CGI/塑料感(仍偶有发生,但更少见)

  • 数据集扩大,训练数据量约为v0.1的2倍

  • 多分辨率训练(1024px 和 1280px,而v0.1仅1024px)

此模型生成的图像

未找到图像。