AmateurTrigger_XL

详情

模型描述

我在这里做的最大项目,已经持续工作了20天,期间进行了多次测试。

总之,正如LoRA这个名字所暗示的,我追求的是一种非常业余、非常真实/自制的风格。

我花了很长时间才找到能够实现我想要渲染效果的技术。

最重要的是,我不想浪费时间一个一个下载图片。因此,我编写了一个图片爬虫,针对几个我确信能找到业余/自制内容的知名网站。我只需输入链接,脚本就能自动下载所有页面上的所有图片。

虽然拥有大量图片很好,但你仍然需要质量。我绝对不想用一堆糟糕的图片来降低训练质量。因此,我必须设计另一个脚本来整理我的下载文件夹,按“重量”、“尺寸”和“质量”进行排序。一旦图片被分门别类地放入各自的文件夹,我只需将顶级图片返回到根文件夹即可。

最终,我仅用几分钟就下载了15,000张图片,但我只保留了……5,000张。不过,对于一个LoRA来说,5000张已经很多了。

在自动排序之后,我还必须再进行一次人工筛选。

因为我绝对想用5000张图片来训练我的LoRA,所以我选择了“微调”类型的训练方式:学习率约为2e-05,网络维度为96,alpha为16,总共训练了11800步(分两次训练,蓝色曲线为第一次)。

图像标注使用了 JoyCaption Alpha 2(处理5000张图片耗时很长,但一夜之间就完成了)。

全部使用“描述性 | 中等长度”预设。

使用 BigLustiMix_rebirth 训练,但像往常一样,它仍兼容所有以 Lustify/BigASP2 为基础的模型。

我建议将强度保持在约0.8,因为这种LoRA在检查点中占用的空间较大,但这也正是我的目标,所以并不意外。毕竟我最初就是为了进行微调。

你会看到那种著名的噪点、颗粒感明显的图片效果,通常采用较低压缩率、基础的照明方式,经常使用手机闪光灯作为光源,但分辨率并未受损——因为我训练这个LoRA时并未使用标准的1024x1024分辨率,而是使用了1216x1216,这使得分辨率略高于SDXL的常规标准。

人物身材也更为自然,姿态整体更显随意,看起来不那么“完美”。

其实没有特定的触发词需要记住。这个LoRA更像是一个大型DLC,而不是一个小插件。我建议将LoRA导入元数据分析工具,以找出最常出现的标签。或者使用我制作的脚本

此模型生成的图像

未找到图像。