YARI (Yet Another Realistic Illustrious ᵐᵒᵈᵉˡ) | Full fine tune based on WAI-NSFW
详情
下载文件
模型描述
我真没想到还需要说这句话,但这个模型需要Danbooru风格的提示词!它基于Illustrious,如果你不使用Danbooru提示词,你将得到糟糕的结果!
v3.0现已推出!本次更新带来以下改进:
- 本版本在保留v2.0多样性的同时,融入了v2.5的细节与真实感增强。
v3.0花费了较长时间,因为我曾尝试使其真正达到照片级真实感,但说实话,虽然这是可行的,结果却让模型变得过于僵硬。我的意思是,它首先无法正确还原角色——例如,当你尝试生成《火影忍者》中的小樱时,你只会得到一个粉发女孩,但她的脸完全不像小樱。此外,提示词遵循度也下降了。这两种症状在其他较为写实的模型中也能看到(当然,这里特指基于Illustrious的模型)。
我决定让我的模型在保持尽可能真实的同时,仍具备足够的灵活性,因此它仍然能够重现Danbooru上200条以上标签的角色,同时也能灵活地生成包含多个角色或奇特姿势等场景。
享受v3.0吧! :)
一个小技巧,可在某些情况下提升角色相似度:
如果Danbooru上某个角色的标签带有括号,你应该在第一个和最后一个括号前添加反斜杠。例如:“raven_(dc)” 应改为 “raven_\(dc\)”。
本模型的目标是将所有角色内置到WAI-NSFW中(完全感谢WAI0731创建了这个了不起的模型),同时拥有更真实的效果。
!!! 重要提示 !!!
由于这是微调(fine-tune),而非合并(merge),现有LoRA将无法与本模型兼容。可能部分LoRA能工作,但绝大多数不行。
我已测试并确认与本模型配合良好的热门LoRA:ExpressiveH,Detail Tweaker XL
以下建议适用于所有版本:
推荐设置:
步数:15-30
CFG比例:5-7
采样器:Euler
原始尺寸请使用大于1024x1024的分辨率
推荐超分设置:
高分辨率放大:1.5
高分辨率步数:20
去噪强度:0.35~0.5
高分辨率放大器:2xNomosUni_span_multijpg_ldl(我测试了多种放大器,这个在生成更真实图像时效果不错,且速度较快)。若追求最佳画质,可使用4xRealWebPhoto_v4_drct-l,但请注意它速度慢得多。
所有预览图均附带工作流,可自动为你计算1.5倍分辨率,无需每次更改分辨率时手动修改多个参数。
所有内容均已包含在检查点中(VAE、文本编码器、UNet)
推荐提示词:
正向提示词
photorealistic, photograph, realistic, masterpiece, best quality, amazing quality, absurdres, detailed_skin
负向提示词
bad quality, worst quality, worst detail, sketch, censor, watermark, signature, text, multiple_poses, multiple_scenes, speech_bubble, patreon_username, multiple_images, multiple_angles, bad_hands, wrong_hand, bad_anatomy, extra_fingers, extra_digits
基本上,WAI-NSFW模型中的所有角色在这里也同样适用,你可以查看所有可用角色:https://huggingface.co/spaces/flagrantia/character_select_saa
当然,由于是全微调,部分角色可能无法再生成,但根据我的测试,我尝试的所有角色都表现良好。
旧版本更新日志:
v2.0现已推出!本次更新带来以下改进:
所有输出的稳定性和提示词遵循度略有提升
数据集扩展,训练数据量约为v1.0的3倍,有助于提升结果多样性
1536px训练,比以往版本产生更多细节
面部表情得到改进:此前版本中, smirk/轻微微笑及其他表情常显得诡异,现已基本修复,所有面部表情应更自然(仍可能出现不良结果,但概率大幅降低)
v1.0现已推出!本次更新带来显著改进:
所有输出的稳定性和真实感增强
减少了CG/塑料感(仍偶有发生,但更罕见)
数据集扩展,训练数据量约为v0.1的2倍
多分辨率训练(1024px 和 1280px,而v0.1仅支持1024px)



















