Bowsette Lora Wan 2.2 14B T2v / I2V
详情
下载文件
模型描述
摘要
请考虑在我的 ko-fi 页面 进行捐赠或订阅。
(所有资金将直接用于制作更多 LoRA 模型)
这是一个用于生成角色“Bowsette”(包括动画和真人风格)的 LoRA 模型。它能较好地生成 NSFW 内容,尽管当前版本未专门训练过裸露图像(我将在下一版本中补充相关数据集训练)。该模型非常多功能,能与其它 LoRA(包括 CausVID LoRA)良好配合(若使用 CausVID LoRA,建议设置 12 步、1 CFG,关闭 SLG/TeaCache)。该模型基于 t2v 14B 模型训练,因此也可作为 i2v 模型 LoRA 使用。
关于本版本(2.2 WAN 14B)
在高、低两种 WAN 14 T2V 模型上进行训练。
我不打算对此进行详细说明。WAN 2.2 刚发布时我尝试了三次,但输出效果都很差。我学到的经验是:
对于角色 LoRA,高模型极其重要。如果基础模型未训练过某些内容,除非专门训练,否则无法生成。我收到的建议相互矛盾:若训练的是真实人物的面部特征,应适度欠训练高模型;但若像 Bowsette 这样要训练全新概念,则必须使用充分训练的高模型。
高低模型均训练约 100 个 epoch,我记不清具体步数,但估计每者约 10K 步?我曾三次训练低模型均失败,直到学习了 WAN 训练方法后,才意识到问题所在。
高模型训练 50 个 epoch 与 100 个 epoch 会产生不同结果。训练不足的高模型无法正确生成:
头冠与面部、粉红色上衣、三缕刘海发型,以及胸前宝石的摆放位置。因此,你需要高 LoRA 来构建这些基础元素,让低 LoRA 能在此基础上补充细节。
本版本训练数据集与 2.1 版本完全相同,也是我最早尝试的角色 LoRA 之一。我认为我应该回来重新整理一些标注(例如:移除头冠、角和头发的标注,让它们自动出现)。此 LoRA 的功能与 2.1 版本一致:使用 “live action” 提示词生成真人版,用 “animated” 生成动画版,反之亦然。
部分示例图像模糊是因为我将其与 Gurren Lagann LoRA 搭配使用时的设置问题。我会在未来提供更多示例。我只是想尽快发布,以便继续其他项目。
使用 DPM++_SDE,CFG 3.5 + 5 Shift(6-8 Shift 也可),高低模型步数分配为 11/9。请参阅主页说明,了解如何在提示词中标记以正确激活该角色。
关于旧版 2.1
V1 与 V1.1 的区别(两者均良好):
V1 更容易切换为动画风格
V2 训练了额外的 NSFW 数据,默认倾向于真人风格,但可通过提示词中的几个关键词修正(见触发词部分)
必要触发词:BowsetteLORA, Bowsette
推荐强度:1.0
(提示词相关信息请见下方)
数据集
包含 51 张仅 Bowsette 的图像(真人 Cosplay 照片与粉丝插画),V1.1 额外增加了 7 张 NSFW 图像,并训练步数翻倍。
分辨率:512x768
主要触发词
必要触发词:BowsetteLORA, Bowsette
可选风格触发词:animated(动画), live action(真人)
我通常在提示词开头使用 “BowsetteLORA”,后续均以 “Bowsette” 指代该角色。
使用 “animated” 或 “anime” 触发动画风格,使用 “live action” 获取真人版本。由于训练数据来自 Cosplayer 的服装,真人风格通常呈现为专业 Cosplay。它也能生成 3D CGI 风格。
V1.1 动画风格提示注意:
V1.1 可能需要额外提示才能获得动画风格,可在正向提示词末尾尝试添加:
anime style, highly detailed traditional animation, 2D character, bright lineart, stylized lighting
并在负向提示词中加入:
realistic, photo, photorealistic, live action, skin pores, DSLR
可选描述性触发词
通常只需 “Bowsette” 即可自动识别其标志性元素(如王冠、角等),但若某些服饰或外观未生成或你希望特别强调,可手动添加描述。有时色彩会不同(如白色角 vs 黄色角)。每个细节都有标注,因此可轻松修改。以下为提示参考词(例如你只需说 “Her tail” 或 “Green shell on back visible” 即可添加);你亦可让她穿上基础模型或其他 LoRA 中的任何服装,或在负向提示中排除这些元素。
角色特征
头发:金色
耳朵:长而尖,精灵状
眼睛:大而明亮的蓝色,常有浓重眼线
嘴巴/牙齿:微笑时露出锐利突出的獠牙
指甲:长、黑色、尖锐
面部表情:调皮、狡黠、自信或狂野
耳环:蓝色泪滴形、圆形耳钉或大球形耳饰
王冠:金色,顶部为粉红色圆顶,常镶嵌红色宝石,有时带有星形或心形标志
角:两根大而光滑、向上弯曲的角(浅棕或白色),从发际长出
外壳:背部有绿色带刺的龟壳,常有白色镶边及浅棕/白色尖刺
尾巴:粗壮的爬行动物尾巴,橙色或棕色,均匀分布浅棕或灰色尖刺
服饰元素
上衣:黑色无肩带紧身胸衣或连体衣,心形领口,多为仿乙烯基/皮革材质,中央镶嵌椭圆形宝石(通常为蓝或绿色)
下装:高开衩紧身衣、短褶裙、飘逸薄纱裙或层次褶边裙
连裤袜:黑色长筒袜(透薄或不透),有时带图案或厚实上缘
鞋子:高跟凉鞋、细高跟鞋或靴子,常带有尖刺脚踝绑带
颈饰:黑色项圈,镶有银色尖刺
臂饰:黑色尖刺腕带和臂环;有时为长及肘部的闪亮臂套
训练信息
使用 3090 显卡本地训练,基于 Diffusion Pipe。
默认设置外的调整:
学习率 2e-5,重复次数 5,transformer dtype float8,save_dtype bfloat16,blocks_to_swap 8
步数:V1 为 1400 步(epoch 22),V2 为 2700 步(epoch 41)
附带所有标注和训练数据示例流程。
我使用 Birme 网站裁剪并调整所有图像大小,然后用 GIMP 移除所有水印与文字,再以每批 5 张图片输入 Google Gemini 2.5 Pro(其图像标注能力令人惊叹)。我以 seruva19 的提示为基础,结合 Gemini 完成全部标注。我希望标注尽可能详细,以便自由更改她的服装、风格与设计,同时保留核心元素(如王冠、尖刺腕带等)。调整初始提示后,标注准确率极高,只需极少修正。不过在约 40 张图片后,标注变得过于冗长,需要重新提示。我手动完成了大量工作,虽然理论上可自动化,但我并不介意这样做。整个过程耗时约 2-3 小时,远比之前为“阴茎 LoRA”做标注轻松得多……
示例标注:
BowsetteLORA,背景为纯浅暖粉色。真人 Bowsette 拥有浓密金色长发,梳成高马尾。佩戴金色王冠,顶部为紫色圆顶,可见粉红色宝石细节。两根大而光滑、浅棕色、向上弯曲的角从发际长出。耳垂佩戴蓝色球形耳环。颈部环绕黑色银刺项圈。身穿黑色闪亮无肩带连体衣,心形领口镶银边。佩戴长至肘部以上的黑色手套,袖口上方有银色纽扣装饰,前臂有白色尖刺纹路。身穿黑色高筒袜,袜口饰有白色尖刺环带,脚穿黑色细高跟鞋。背部有绿色龟壳,镶白色边,突出长而尖的白色刺。从龟壳下方延伸出一条粗厚柔软的黄色尾巴,饰有白色尖刺。她身体侧倾站立,一手抬起呈爪状,直视镜头。全身照。
特别感谢
一如既往,感谢 seruva19、Ghibli 和 Red Line 的 LoRA 发布及训练数据,它们始终是我灵感与知识的来源。
Banodoco Discord 社区,始终耐心解答我的训练问题。
Kijai,感谢他出色的节点与使用建议。
