YARI (Yet Another Realistic Illustrious ᵐᵒᵈᵉˡ) | Full fine tune based on WAI-NSFW
详情
下载文件
模型描述
我真没想到还得说这个,但模型需要Danbooru风格的提示词!它基于Illustrious,如果你不使用Danbooru提示词,将会得到糟糕的结果!
v3.0 现已发布!本次更新带来了以下改进:
- 本版本融合了v2.5的细节与真实感增强,同时保留了v2.0的多样性。
v3.0 花费了较长时间,因为我尝试让它真正达到照片级真实感,但老实说,虽然这确实可行,却会导致模型过于僵硬。我的意思是,它首先无法正确还原角色,比如你尝试生成《火影忍者》中的小樱时,最终只会得到一个粉发女孩,但她的脸完全不像小樱。此外,提示词遵循性也会下降。这两种症状在其他较写实的模型中也能看到(当然,我特指基于Illustrious的模型)。
我决定让我的模型在尽可能真实的同时仍保持灵活性,因此它仍能准确还原Danbooru上200条以上标签的角色,并且依然足够灵活,可以生成多角色、奇怪姿势等场景。
享受v3.0吧! :)
一个小技巧,有时能提升角色相似度:
如果Danbooru上某个角色的标签带有括号,你应该在第一个和最后一个括号前加上反斜杠。例如:“raven_(dc)” 应改为 “raven_\(dc\)”。
本模型的目的是将所有角色内置到 WAI-NSFW 中(完全致敬 WAI0731 创建的这个惊人模型),同时拥有更真实的效果。
!!! 重要提示 !!!
由于这是微调,而非合并,现有的LoRA将无法与此模型兼容。可能有部分LoRA能工作,但绝大多数不行。
我已测试并确认与本模型配合良好的热门LoRA:ExpressiveH,Detail Tweaker XL
以下建议适用于所有版本:
推荐设置:
步数:15-30
CFG缩放:5-7
采样器:Euler
原始尺寸请使用大于 1024x1024 的分辨率
推荐超分设置:
高分辨率放大:1.5
高分辨率步数:20
去噪强度:0.35~0.5
高分辨率放大器:2xNomosUni_span_multijpg_ldl(我测试了多种超分器,这个在生成更真实图像时效果相当好,且速度很快)
所有预览图均附带工作流,可自动为你计算1.5倍分辨率,无需每次更改分辨率时手动调整多个参数。
所有组件(VAE、文本编码器、UNet)均已整合至检查点中。
推荐提示词:
正向提示词
photorealistic, photograph, realistic, masterpiece, best quality, amazing quality, absurdres, detailed_skin
负向提示词
bad quality, worst quality, worst detail, sketch, censor, watermark, signature, text, multiple_poses, multiple_scenes, speech_bubble, patreon_username, multiple_images, multiple_angles, bad_hands, wrong_hand, bad_anatomy, extra_fingers, extra_digits
基本上,WAI-NSFW模型中的所有角色在这里也能使用,你可以在此查看所有可用角色:https://huggingface.co/spaces/flagrantia/character_select_saa
当然,由于是完整微调,部分角色可能已无法生成,但根据我的测试,我尝试的所有角色都能正常工作。
旧版本更新日志:
v2.0 现已发布!本次更新带来以下改进:
所有输出的稳定性和提示词遵循性略有增强
数据集扩大,训练数据量约为v1.0的3倍,有助于提升结果多样性
1536px训练,比以前版本生成更多细节
面部表情优化:以前版本中,微笑、撇嘴等表情常显得诡异,现已基本解决,所有面部表情效果更好(仍可能出错,但概率大幅降低)
v1.0 现已发布!本次更新带来显著改进:
所有输出的稳定性和真实感增强
减少了CGI/塑料感(仍偶有发生,但更少见)
数据集扩大,训练数据量约为v0.1的2倍
多分辨率训练(1024px 和 1280px,而v0.1仅1024px)



















