(Project Sekai) Hoshino Ichika F.1 Dev LoRA Model
详情
下载文件
模型描述
Hoshino Ichika F.1 Dev LoRA 模型
基于基础模型 FLUX.1 Dev 的 LoRA 模型。
我使用了两种不同的图像进行训练:卡片(不透明)和剪影(透明)。因此背景将是单色的,不够灵活,我认为。所以你可以自由控制背景,我觉得。
使用方法
这个 LoRA 可以通过单个词 "hoshino ichika" 触发。不过,我仍建议你在提示词中先添加 "hoshino ichika, 长发, 蓝眼睛(或灰眼睛), 黑发(或许 '蓝发' 也可以?)",以确保角色特征正确。(如果你使用 ComfyUI-nunchaku 工作流,甚至不需要所谓的触发词。)同时,建议仅使用 Danbooru 数据集中的标签。
另外,我仅测试了 LoRA 权重为 1.25 的情况,不清楚较低权重是否仍能正常输出。(你可以自行测试,并在评论区告诉我结果。)
在我的测试中,借助 nunchaku,
我可以在权重为 1 的情况下使用该 LoRA,且无需在提示词中输入 LoRA 文件名。
角色介绍
一些基本的训练参数
训练素材以人物卡面为主(Cards + Cutouts),其中 Cutouts 为透明,Cards 不透明。
训练脚本直接采用 sd-scripts 的 SD3 分支,并受 fluxgym 编写脚本的启发,自行手动编写脚本和数据配置。
由于本人笔记本配置较差,每次训练效率不高,至今仍未找到有效降低 avr_loss 的方法(除了增加 steps,但那样更耗时)。
如何使用这个 LoRA
与正常使用 SD 1.5 的 LoRA 相同,使用 FLUX.1 Dev 作为基础模型,并使用触发词 'hoshino ichika' 激活 LoRA(小提示:如果你采用与我相同的 ComfyUI-nunchaku 工作流加载该 LoRA,甚至连这个触发词都不用写,直接描述角色主要特征即可)。权重默认设为 1 即可。当然,为确保角色基本特征被正确触发(我通过删减部分标签来固定人物特征,实际证明可能并无太大效果(?)),建议添加 "hoshino ichika, 长发, 蓝眼睛(或灰眼睛), 黑发(或许蓝发也可以?)" 等特征词,并尽可能仅使用 DeepBooru 词库中的词语。
面临的挑战
由于该 LoRA 仅针对这一新角色进行训练,因此在肢体等细节方面仍存在明显不足。遗憾的是,F.1 并不像 SD 1.5 那样可随意加入 embeddings 来临时解决肢体问题(可尝试加入 ControlNet 以控制图像走向,或许有效)。我的建议是:多抽几次卡吧(
(当然,如果你有更好的解决方案,欢迎在评论区指点,本人将不胜感激 x)









