(Project Sekai) Momoi Airi F.1 Dev LoRA Model
详情
下载文件
模型描述
Momoi Airi F.1 Dev LoRA 模型
基于基础模型 FLUX.1 Dev 的 LoRA 模型。
我使用了两种不同类型的图像进行训练:卡片(不透明)和剪影(透明)。因此,背景将是单色的,不够灵活,我认为。所以你可以自由控制背景,我觉得。
使用方法
这个 LoRA 可以通过单个词“momoi airi”触发。但我仍建议你先在提示词中添加“momoi airi, long hair, pink eyes, pink hair”,以确保角色特征正确呈现。(如果你使用的是 nunchaku 工作流,甚至不需要使用所谓的触发词)此外,建议仅使用 Danbooru 数据集中的标签。
我仅测试了 LoRA 权重为 1.25 的情况,尚不确定更低的数值是否仍能生成正常结果。(你可以自行测试并在评论区告知我)
在我的测试中,借助 nunchaku,
我可以使用权重为 1 的 LoRA,且无需在提示词中输入 LoRA 文件名。
角色介绍
一些基本的训练参数
训练素材以人物卡面为主(Cards + Cutouts),其中 Cutouts 为透明,Cards 不透明。
训练脚本基于 sd-scripts 的 sd3 分支,并受 fluxgym 脚本启发,自行手工编写脚本与数据设置。
由于我的笔记本配置较差,每次训练效率不高,且至今尚未找到有效降低 avr_loss 的方法(除了增加 steps,但这会更耗时)。
如何使用此 LoRA
与正常使用 SD 1.5 的 LoRA 一样,使用 FLUX.1 Dev 作为基础模型,通过触发词“momoi airi”激活 LoRA(小提示:如果你采用与我相同的 nunchaku 工作流加载此 LoRA,甚至无需写这个触发词,直接描述角色主要特征即可)。权重默认设为 1 即可。当然,为确保角色基本特征被正确触发(我通过删减部分标签来固定人物基本特征,这是本期训练策略的调整),建议添加“momoi airi, long hair, pink eyes, pink hair”等特征词,并尽可能仅使用 DeepBooru 词库中的词语。
面临的挑战
由于该 LoRA 仅针对这一新角色进行训练,因此在肢体等细节方面仍有较大不足。遗憾的是,F.1 并不像 SD 1.5 那样可随意加入 embeddings 来暂时解决肢体问题。我的评价是:反复抽卡吧(
(当然,如果你有更好的解决方案,欢迎在评论区指点,我将不胜感激 x)






