NEW ERA / LORA / PONY DIFFUSION

详情

下载文件

模型描述

这是模型训练的一个全新里程碑,我最初的目标不仅是制作一款复古风格的模型,而是打造一个真正意义上的复古工具,它不是模仿旧日动画,而是完全重现那些经典作品。通过这次发布,我已经向这一目标迈出了更近的几步。 (使用 BOORU 标签)

NEW ERA 5.0 (NAI) / 模型

该模型的基础是加入80至00年代的艺术家,以及大量角色

让我们按顺序来说明:

此次发布略有延迟,因为我试图改进已完成的LoRA,提升细节和体积感,但发现当前所有尝试都无效,因此我需要更深入地研究这一课题。不过,最终成果相较于初版已有显著提升——你可能会问,为什么LoRA会比模型更好?原因在于:我训练时充分利用了全部显存,据我的计算,最佳LoRA(或模型)需要约60-70GB显存,而我的24GB显存虽不足以达成完美,但足以让神经网络开始真正记住角色及其风格。尤其是那些不寻常的面部、眼睛、鼻子,甚至非标准体型。我仍相信此过程可进一步优化,但现阶段这是我所能达到的极限。

LoRA权重:0.7–1(权重为1时会出现解剖结构问题,因LoRA训练时间极长)

CFG Scale:3–4 (重要提示!请使用CFG Scale 3,我尚未解决高CFG Scale导致艺术效果淡化的问题,因此请务必使用较低数值。但不要使用过低数值,以免出现解剖结构问题)

提示词:retro artstyle, 1girl <lora:NEW ERA_v2.1:0.8>

第4条尾巴(Hentai模型) 非常重要:必须使用该模型,因为这是我训练数据集所基于的模型。在其他模型上(除原始Pony外),会出现艺术家、角色识别错误,且其对LoRA的影响过于强烈

提示词:masterpiece, best quality

负面提示词:worst quality, low quality, bad hands, fewer digits, extra digits, bad anatomy, english text, engrish text

anime screencap, anime coloring — 两个强力提示词,表现极佳,能让图像看起来如同动漫截图,可同时使用以增强效果,也可单独使用。

retro artstyle — 主要的复古风格提示词,几乎存在于所有训练图像中,可产生1980–1990年代风格的不同效果。

1990s \(style\) — 非常强力的提示词,显著改变模型风格。

1980s \(style\) — 目前与上一个基本相同(原因是90年代风格大量包含早期90年代内容,而早期90年代与80年代风格非常相似

2000s \(style\) — 仍不完美,但略接近00年代风格。

多角色展现

现在已不再是“双胞胎”式的角色,他们并非完全一致的情绪、肤色、发型、服装等。

提示词:

score_9, source_anime, 3girls, 1980s \(style\), cleavage, by kawarajima kou, smile, open mouth, one eye closed, serious, closed mouth, official art lora:NEW\_ERAv2.1:1

如你觉得质量不满意,可使用 Pony Diffusion 的标准提示词:

score_9, source_anime, score_8_up, score_7_up, best quality

我需要明确指出,目前社区中关于在神经网络中使用艺术家姓名存在诸多争论。我直白地说:我毫不在意。我不会将艺术家名称隐藏成三个字母编码,以阻碍人们在模型中寻找他们(就像 Pony Diffusion 创作者所做的那样,这是他的自由,我并不指责,但我自己不会这么做)。我将大量添加艺术家、角色及动漫标题的原名。

目前支持的艺术家如下(提示词前请始终加上“by”):

by urushihara satoshi

by danmakuman

by kitazume hiroyuki - 还需补充更多

by kawarajima kou

by kotobuki tsukasa

by hirano toshihiro - 还需稍作补充

数据集中还存在其他艺术家,但其对LoRA的影响仍较弱。

目前我尚未整理已添加角色的清单,因为角色数量太多,我担心自己尚未准备好投入时间整理,但未来极有可能会更新。

若您想了解详细信息,请参阅我的帖子 NEW_ERAv1.0,其中已详细说明。

以下信息仅适用于基于 Stable Diffusion 1.5 的旧版模型:

小版本对比(SD 1.5):

模型对比(SD 1.5):

我已制作了一段视频,演示如何达到相同的画质,或复现我的艺术风格。

手部特征终于达到了90年代风格。经历了诸多困难与数十个版本的调整,我找到了理想的平衡点,并将以此为基础继续推进未来的更新。

请尽可能使用高分辨率修复(hires fix),以充分发挥显卡性能,避免报错。使用 hires fix 2 与 Latent(nearest-exact)上采样器,图像将更加精细。若希望风格贴近原作但细节更丰富,请将去噪强度(Denoising strength)控制在0.55以下;但为避免伪影,也不宜过低,最佳值为0.5。

针对 SD 1.5:请使用 Abyssorangemix3aom3_aom3a3.safetensors 模型,并搭配以下负面提示词:
(worst quality, low quality, extra digits:1.4)

并搭配我的其它 LoRA

如何在 Auto1111 中使用 LoRA:

  • 更新 WebUI(使用 git pull 参考此处 或重新下载)

  • 将文件复制到 stable-diffusion-webui/models/lora

  • 如视频所示进行 LoRA 选择 此视频

  • 请务必调整权重(默认为 :1,通常过高)

* 信息来源:Lykon

请分享你的作品,无论是否附带评论,这将帮助我不断改进。谢谢!

如果你喜欢我的作品,请点击上方的心形按钮,我会非常开心 :3

此模型生成的图像

未找到图像。