(Project Sekai) Momoi Airi F.1 Dev LoRA Model

详情

下载文件

模型描述

Momoi Airi F.1 Dev LoRA 模型

基于基础模型 FLUX.1 Dev 的 LoRA 模型。

我使用了两种不同类型的图像进行训练:卡片(不透明)和剪影(透明)。因此,背景将是单色的,不够灵活,我认为。所以你可以自由控制背景,我觉得。

使用方法

这个 LoRA 可以通过单个词“momoi airi”触发。但我仍建议你先在提示词中添加“momoi airi, long hair, pink eyes, pink hair”,以确保角色特征正确呈现。(如果你使用的是 nunchaku 工作流,甚至不需要使用所谓的触发词)此外,建议仅使用 Danbooru 数据集中的标签。

我仅测试了 LoRA 权重为 1.25 的情况,尚不确定更低的数值是否仍能生成正常结果。(你可以自行测试并在评论区告知我)

在我的测试中,借助 nunchaku

我可以使用权重为 1 的 LoRA,且无需在提示词中输入 LoRA 文件名。

角色介绍

Sekaipedia


一些基本的训练参数

训练素材以人物卡面为主(Cards + Cutouts),其中 Cutouts 为透明,Cards 不透明。

训练脚本基于 sd-scripts 的 sd3 分支,并受 fluxgym 脚本启发,自行手工编写脚本与数据设置。

由于我的笔记本配置较差,每次训练效率不高,且至今尚未找到有效降低 avr_loss 的方法(除了增加 steps,但这会更耗时)。

如何使用此 LoRA

与正常使用 SD 1.5 的 LoRA 一样,使用 FLUX.1 Dev 作为基础模型,通过触发词“momoi airi”激活 LoRA(小提示:如果你采用与我相同的 nunchaku 工作流加载此 LoRA,甚至无需写这个触发词,直接描述角色主要特征即可)。权重默认设为 1 即可。当然,为确保角色基本特征被正确触发(我通过删减部分标签来固定人物基本特征,这是本期训练策略的调整),建议添加“momoi airi, long hair, pink eyes, pink hair”等特征词,并尽可能仅使用 DeepBooru 词库中的词语。

面临的挑战

由于该 LoRA 仅针对这一新角色进行训练,因此在肢体等细节方面仍有较大不足。遗憾的是,F.1 并不像 SD 1.5 那样可随意加入 embeddings 来暂时解决肢体问题。我的评价是:反复抽卡吧(

(当然,如果你有更好的解决方案,欢迎在评论区指点,我将不胜感激 x)

此模型生成的图像

未找到图像。