Jet Set Radio 🎨 Flux.1-D
详情
下载文件
模型描述
概述
这个 LoRA 基于 Jet Set Radio 的角色原画,是一次小小的实验。我原本根本没想到它能成功,因为它的数据集完全违背了我制作 Flux LoRA 时通常遵循的所有规则。
😨 仅使用了 26 张图像(对我来说,用少于 200 张图像制作 LoRA 已经是大逆不道了!)
😨 所有图像都是白色背景上的角色原画(缺乏多样性令人痛苦,我甚至没有做任何增强处理!)
😨 标注极其简略,仅写“JSR 风格”(作为 JoyCaption 的忠实用户,我觉得这是对我的侮辱!)
然而,最终效果还不错。它有一种怪异而 funky 的氛围,我很喜欢。尽管它显然未能还原 Jet Set Radio 游戏内的图形风格(因为我仅使用了原画),但其风格仍具有辨识度和独特性。
它更偏爱简短的提示词,有时会回退到写实背景,尤其当提示中提到与照片相关的元素或过于详细时。这很可能是因为数据集仅包含白色背景图像,而非真实环境图像。不过,偶尔这种效果反而很酷,让角色看起来像漫画英雄置身于现实世界中。
此外,如果提示中未指定背景,它可能默认使用纯白色背景。即使提示中未提及人物,它也常自动添加人物,因此最好明确描述前景中应出现的内容。
我计划通过使用从本 LoRA 本身生成的合成数据集重新训练模型,来解决这些问题。
使用方法
图库中的图像使用以下设置生成:
模型:flux1-dev (fp8e4m3fn)
文本编码器:t5pxxl_fp16
采样器:euler
调度器:24 步(标准)
Flux 引导:4
LoRA 强度:1
训练
该 LoRA 使用 RTX 3090 和 AI Toolkit 进行微调,超参数如下:
秩/α:8/1
优化器:prodigy
步数:2800
批次大小:1
学习率:1
学习率调度器:余弦
解耦:true
使用偏置校正:true
Betas:(0.9, 0.99)
权重衰减:0.01
D 系数:0.9
噪声偏移:0.1
分辨率:(512, 768, 1024)




















