Vanillaware Style PonyXL

详情

下载文件

模型描述

本模型的训练及其生成的图像仅用于学习目的。

我什么都没做,我只是个搬运工。

这个模型更像一个角色包,其副作用是它带来的风格。

我花费了30多个小时反复尝试,期间几乎想要放弃,但最终实现了更平衡的效果。最重要的是,我的训练假设得到了验证。未来,我可能会将这些经验整理成一篇文章。

但手部问题依然存在。

触发词:vanillastyle

你可以在上方的图片中找到示例提示词。

前一版本模型的提示词大多也适用。

我的提示词基本按以下顺序组成:[角色特征] + [风格] + [表情] + [服装] + [镜头与动作] + [背景],你可以根据需要删除或修改。

如果出现特别模糊的情况,可尝试在负面提示中加入“thumbnail”并提高其权重,直到图像变得清晰。

在负面提示中加入“3d”可能获得更好效果;而添加如“realistic”或“realism”等标签则可增强人物特征。

推荐权重:1.0~0.6,请根据需要调整,直至角色外观符合你的要求。

推荐放大倍数约为1.2~2.0,去噪强度为0.2。

数据集主要聚焦于神谷盛治的作品。

20240907v0.2

在这一版本中,我为更多图像添加了标签,其余图像则移除了标签,仅保留触发词,以避免与精心标注的标签产生冲突。(这种方法可能有误。)

在训练过程中,数据集中大量图像无法通过提示词准确呈现。我尝试了各种标签修改并重新训练,结果依然相同。这些图像在数据集中的重复性也不高,缺乏连续性。

最终,我读到一篇文章,提到增加某些角色的训练次数,以防止模型未能充分学习这些图像。

因此,我将数据集中所有孤立存在的图像放入一个子文件夹,设置训练次数为2,而对已充分学习的图像保持不变。

然而,由于这些不连续图像存在较多质量缺陷,我暂未修复,提高其训练次数对整体风格造成了一定影响。

为改进下一版本,最根本的方法是提升数据集质量,同时善用标注技术:为那些质量稍差的图像添加相同的标签,然后在运行模型时将这些标签统一放入负面提示中。

20240715v0.1

该模型只能被视为v0.1版本,正常使用并不容易,我认为最好对数据集中的图像进行更细致的标注以获得更好效果。未来,我可能会逐步完成该模型的训练。

此版本表现不佳,生成的图像常显得杂乱无章。

我收集了100多张图像作为数据集,但手动标注数量仍过于庞大。我最初使用wd1.4为所有图像标注,但标注质量依然不佳(也许是我使用方法不够正确,欢迎各位提出建议)。

由于我急于看到结果,因此仅对部分符合我个人偏好的图像进行了手动标注,因此模型对这些图像的输出效果会更好。

此模型生成的图像

未找到图像。