YARI (Yet Another Realistic Illustrious ᵐᵒᵈᵉˡ) | Full fine tune based on WAI-NSFW

详情

模型描述

我真没想到还需要说这句话,但这个模型需要Danbooru风格的提示词!它基于Illustrious,如果你不使用Danbooru提示词,你将得到糟糕的结果!

v3.0现已推出!本次更新带来以下改进:

  • 本版本在保留v2.0多样性的同时,融入了v2.5的细节与真实感增强。

v3.0花费了较长时间,因为我曾尝试使其真正达到照片级真实感,但说实话,虽然这是可行的,结果却让模型变得过于僵硬。我的意思是,它首先无法正确还原角色——例如,当你尝试生成《火影忍者》中的小樱时,你只会得到一个粉发女孩,但她的脸完全不像小樱。此外,提示词遵循度也下降了。这两种症状在其他较为写实的模型中也能看到(当然,这里特指基于Illustrious的模型)。

我决定让我的模型在保持尽可能真实的同时,仍具备足够的灵活性,因此它仍然能够重现Danbooru上200条以上标签的角色,同时也能灵活地生成包含多个角色或奇特姿势等场景。

享受v3.0吧! :)

一个小技巧,可在某些情况下提升角色相似度:

如果Danbooru上某个角色的标签带有括号,你应该在第一个和最后一个括号前添加反斜杠。例如:“raven_(dc)” 应改为 “raven_\(dc\)”。


本模型的目标是将所有角色内置到WAI-NSFW中(完全感谢WAI0731创建了这个了不起的模型),同时拥有更真实的效果。

!!! 重要提示 !!!

由于这是微调(fine-tune),而非合并(merge),现有LoRA将无法与本模型兼容。可能部分LoRA能工作,但绝大多数不行。

我已测试并确认与本模型配合良好的热门LoRA:ExpressiveHDetail Tweaker XL

以下建议适用于所有版本:

推荐设置:

步数:15-30

CFG比例:5-7

采样器:Euler

原始尺寸请使用大于1024x1024的分辨率

推荐超分设置:

高分辨率放大:1.5

高分辨率步数:20

去噪强度:0.35~0.5

高分辨率放大器:2xNomosUni_span_multijpg_ldl(我测试了多种放大器,这个在生成更真实图像时效果不错,且速度较快)。若追求最佳画质,可使用4xRealWebPhoto_v4_drct-l,但请注意它速度慢得多。

所有预览图均附带工作流,可自动为你计算1.5倍分辨率,无需每次更改分辨率时手动修改多个参数。

所有内容均已包含在检查点中(VAE、文本编码器、UNet)

推荐提示词:

正向提示词

photorealistic, photograph, realistic, masterpiece, best quality, amazing quality, absurdres, detailed_skin

负向提示词

bad quality, worst quality, worst detail, sketch, censor, watermark, signature, text, multiple_poses, multiple_scenes, speech_bubble, patreon_username, multiple_images, multiple_angles, bad_hands, wrong_hand, bad_anatomy, extra_fingers, extra_digits 

基本上,WAI-NSFW模型中的所有角色在这里也同样适用,你可以查看所有可用角色:https://huggingface.co/spaces/flagrantia/character_select_saa

当然,由于是全微调,部分角色可能无法再生成,但根据我的测试,我尝试的所有角色都表现良好。

旧版本更新日志:

v2.0现已推出!本次更新带来以下改进:

  • 所有输出的稳定性和提示词遵循度略有提升

  • 数据集扩展,训练数据量约为v1.0的3倍,有助于提升结果多样性

  • 1536px训练,比以往版本产生更多细节

  • 面部表情得到改进:此前版本中, smirk/轻微微笑及其他表情常显得诡异,现已基本修复,所有面部表情应更自然(仍可能出现不良结果,但概率大幅降低)

v1.0现已推出!本次更新带来显著改进:

  • 所有输出的稳定性和真实感增强

  • 减少了CG/塑料感(仍偶有发生,但更罕见)

  • 数据集扩展,训练数据量约为v0.1的2倍

  • 多分辨率训练(1024px 和 1280px,而v0.1仅支持1024px)

此模型生成的图像

未找到图像。