NEW ERA (New Esthetic Retro Anime)

详情

模型描述

90年代、80年代与00年代风格的综合模型

我重新恢复了我的PATREON(或者更准确地说,在获得Patreon许可后创建了一个新的),如果有人想支持我,我已经将所有在BOOSTY上付费的全新模型和LORAs打包成一个存档上传到那里。即使你只是免费订阅Patreon,我也会非常高兴,因为这让我知道你在关注我的作品,并希望看到更多更新。

关于v5.0:

决定基于NAI-XL构建此模型,其质量相比最新LORA有巨大飞跃。由于该模型易于微调,因此在环境细节、眼睛、解剖结构、手指、服装多样性方面均有提升,更重要的是降低了对比度。在v3.0版本中,对比度过高,难以使用额外的LORA,必须将CFGscale设置为2.5;而现在,相同对比度下的CFGscale约为4,为使用额外LORA留出了充足空间。

使用Latent(nearest-exact)放大时,伪影显著减少(有时完全消失),表明质量大幅提升,解剖结构也得到改善(放大时解剖结构更稳定地保持在正确范围内)。

工作流(只需复制设置,除负向提示外的所有参数,最佳选项如下):

图片链接

关于v6.3 & 6.69:
最终花费了更长时间,因为我重新进行了微调并训练了LORA以改进此模型(同时,重新安装Python后我的所有WebUI均崩溃,不得不全部修复)。

我必须立刻说明,此模型并非基于epsilon,而是基于v-pred(速度预测)。v-pred与epsilon(ε预测)是扩散模型中对噪声进行参数化的两种不同数学方法。简而言之,对于动漫风格,采用正确设置时,vpred表现更优。但其存在严重的图像“烧毁”问题,并且在零SNR时收敛性略差(而vpred应在零SNR下使用)。我通过为v参数化设置正确参数、完全禁用SNR、自动调节噪声(而非SDXL使用的固定值)等方法,解决了高对比度与色彩丢失的问题。这并不容易,因为互联网上缺乏实际数据,我通过反复试验并仔细研读有关v-pred的科学论文,才理解了一些微妙之处。事实上,Civitai上的原始NOOBAI模型训练有误,考虑到曾有大量用户协助其设置与训练,这实在颇具讽刺意味。

实际上,v-pred极其挑剔且并不完美,希望未来混合方法的发展能消除当前的局限,但这将需要对扩散模型架构进行根本性变革。

回到模型本身,为何有两个版本?我注意到面部和眼睛的细节略有下降(虽不严重,但很重要),因此我决定创建6.69版本,最初专门训练LORA以改善面部,并进一步调整解剖结构,现已达到新高度。但在70-75%的情况下,6.3版本在阴影表现上视觉效果更好约5%,虽然对很多人而言并不显著,但对我来说很重要,因此我提供选择。6.69版本在解剖结构上更优,6.3版本在阴影表现上略优。(我先发布6.3版)

以下是各版本与5.0版的对比(所有图像均以1024x1056分辨率生成,未进行放大):
采样器对比:

[

](https://boosty.to/girlsai/posts/49b336b1-136e-40a6-9dbc-4c11dd659767/media/e4c661d4-572e-4364-8dad-873ba7ba4b1c?from=blog_post)**现在我们来讨论此模型在极端分辨率下解剖一致性表现如何,相比旧模型,我通过添加** 标题丢弃率和网络丢弃率0.05,使一致性大幅提升。分辨率为1400x2000(尽管有此结果,该分辨率仍属极端,不推荐使用,建议使用Latent(nearest-exact)放大)

我的工作流
正面提示词:masterpiece, best quality, newest, official art, absurdres, highres

负向提示词:worst quality, low quality, (censored, bar censor, mosaic censoring, 4koma), multiple views, blurry, artistic error, bad anatomy, bad feet, wrong foot, bad hands, bad proportions, bad perspective, bad leg, bad arm, bad neck, bad vulva, bad reflection, bad ass, bad face, english text, chinese text, watermark, simple background

负向提示词为标准设置,采用Danbooru网站中所有不良解剖相关标签,唯独一个例外——simple background(简单背景),我发现vpred模型非常喜欢简化背景,此负向提示词有助于改善整体细节。

RescaleCFG已不再需要。现在你可以在comfiforgereforge甚至标准的automatic1111中稳定使用。

请记住,vpred模型非常喜爱详细的描述,请使用来自danbooru网站的booru标签。虽然“1girl”等常规标签有效,但图像会被尽可能简化和标准化,这是此类模型不可避免的特性;而epsilon模型在这方面更多样化,但在其他所有方面均逊色(绝对全面落后)。

如尚未安装,请安装“sd-webui-tagcomplete”扩展插件。它可为“image booru”板(如Danbooru)中识别的标签提供自动补全提示,这些板主要用于浏览动漫风格插画。

CFG Scale - 任意值,不再有过度对比度的问题。建议设置为5-7(标准值)。

哦对了,差点忘了,我新增了大量来自吉卜力工作室80年代、90年代和00年代动画的全高清图像,现在你可以创作出该工作室风格的艺术作品。包括宽屏图像的解剖结构也变得更好了。

新增动画:

萤火虫之墓

龙猫

千与千寻

哈尔的移动城堡

天空之城

NEW_ERA_v7.1 (NAI V-PRED) PATREON(复古艺术新高度,远超6.3与6.69版本,更稳定、更美观、更易实现)

NEW ERA 4.0 (ILLUSTRIOUS-XL) / SDXL / LORA

NEW ERA v1.0(SDXL / PONY DIFFUSION版本,综合了我几乎所有流行模型,侧重复古动漫风格)

P.P.S. 新模型 Anime Screencap / LORA / PONY DIFFUSIONBoosty 上发布

我制作了一个 视频 ,教你如何达到相同效果或复刻我的作品

完美负向提示词(我直接采用了Danbooru的所有负面标签):

负向提示词:worst quality, low quality, (censored, bar censor, mosaic censoring, 4koma), multiple views, blurry, artistic error, bad anatomy, bad feet, wrong foot, bad hands, bad proportions, bad perspective, bad leg, bad arm, bad neck, bad vulva, bad reflection, bad ass, bad face, english text, chinese text, watermark, simple background

复古艺术风格——主要复古标记,存在于几乎所有训练图像中,可产生80-90年代的不同效果

1990s \(style\)——非常强的风格标识,显著改变模型风格

1980年代(风格) - 最终对结果产生了显著影响

2000年代(风格) - 比以前好得多

动漫截图,动漫上色 - 两个强力标签,效果极佳,能使图像看起来像动漫截图,可同时使用以提升效果,也可单独使用

照片背景 - 使环境更真实,同时保持角色为动漫风格(为此模型进行了调整)

别忘了在提示语开头写上:masterpiece, best quality

艺术家:

by urushihara satoshi

by danmakuman

by kitazume hiroyuki

by kawarajima kou

by kotobuki tsukasa

by hirano toshihiro

新增:

by mikimoto haruhiko

by kajishima masaki

by saotome nanda

by hakumai gen

P.S. 7.9V(基于1.5)

在 Civitai 生成服务上使用 - 勾选框已勾选,但不知为何不起作用

你可以使用 RescaleCFG 为 reForge 降低对比度

请发布你的作品,无论是否附带评论,这将帮助我改进。谢谢!

如果你喜欢我的作品,请点击上方的心形图标,我会非常高兴 :3

此模型生成的图像

未找到图像。