Aiko Umesawa ( Danganronpa ) [SD 1.5]

详情

模型描述

来自《弹丸论破3》动画的雨宫爱子。又称“皮卡丘女孩”,又称《弹丸论破3》动画中穿着黄色连帽衫、手持平底锅的学生会成员。这个项目最初是一次实验,旨在测试我在训练数据极其有限的情况下能取得多好的效果。随后我将其从Flux迁移至SDXL,而SDXL在数据源更少的情况下表现更差;接着又迁移到SD 1.5,它面临的困难更大?这个LoRA出现问题是毫不意外的。但即便存在问题,我认为其成果仍属可接受范围。使用时请牢记这只是一个实验性质的LoRA。它至少能用,这本身比它偶尔表现不稳定更令人惊讶——毕竟,她只在《弹丸论破3》动画的一集里出现过短短一幕,这根本算不上高质量的训练数据!

重要提示:这个Stable Diffusion 1.5 LoRA是基于我原始的Flux版雨宫爱子训练数据转换而来。简而言之,这个SD 1.5 LoRA因适配一个截然不同的框架而略有缺陷。不过,测试结果仍属可接受。但确实存在一些问题:最大的问题是,你必须花大力气调整负面提示,才能防止GUI元素渗入图像。更多相关信息请见本说明后文。

对您来说,它的表现可能会有些不可预测。在模型方面,我用Lustermix 2D和Ghostmix取得了最佳效果。Juggernaut Reborn只需在提示中加入“photo, RAW photo”标签,就能很好地将其转化为写实或接近写实的风格。此外,使用所有模型时,我通常都用ADetailer处理面部细节。最后,标签杂乱且冗余严重——这是半自动化转换的代价。我计划近期重写代码,让输出更整洁一些。

独特之处:我在制作《弹丸论破》LoRA时最强调的一点是忠实还原原作素材。要还原角色的基本造型或服装相对容易,但要还原其性格特征却困难得多。模型本身对“恐惧”、“快乐”、“悲伤”或“愤怒”的表情或姿态都有自己的理解。但《弹丸论破》中的角色,其设计在每一个情绪状态上都经过精心打磨,确保它们彼此独特。我会仔细收集每一个精灵图、每一张CG、每一个我能找到的官方图片,进行标注并纳入数据集,以期最好地还原这种细节。是否成功是另一回事,但这正是我的目标,也是这些LoRA有时显得怪异的原因。而SD 1.5的转换版,这种不可预测性更甚。不过,我认为它们仍提供了一种值得尝试的角色诠释。以雨宫爱子为例,我特别高兴看到,当她表现出压力状态时,有时会紧紧抓着连帽衫的绳子——这是训练数据中形成的关联,而这正是我方法论希望保留的细节:角色的特征应当被完整保留,对吧?

我训练时使用了几种特定类型的图像,您可以尝试复现,但效果因模型而异。这类提示在Flux中效果很好,在SDXL中尚可,在SD 1.5中通常很差。我尽量在图像中包含各种提示选项,方便您对比。以下是主要提示类别:

负面提示——为避免系统生成游戏文本或GUI元素,请在负面提示中加入: (((danganronpa S GUI style speech bubble))), (((name bubble))), (((speech bubble))), blue speech bubble, text box:danganronpa S GUI style, GUI style, speech bubble, danganronpa S GUI style, ((no people)), (((text))), (((gui)))

《弹丸论破》动画风格:若想让图像呈现《弹丸论破》动画的风格,请在提示中加入标签:'Danganronpa The Animation, screencap from the anime Danganronpa The Animation, anime, dr1anime',以模仿动画的美术风格。

《弹丸论破3》(动画)风格:使用 "Danganronpa 3 screencap style, danganronpa 3, anime"

《弹丸论破》精灵图风格:在提示中加入标签 'danganronpa sprite style' 以尝试模仿《弹丸论破》的美术风格。尽管名称如此,但我训练时使用的是包含和不包含GUI的完整截图,以及角色精灵图的截取素材,理论上它应能“弹丸论破化”整张图像。但困难在于,雨宫爱子并未出现在任何游戏中——我也只能尽力而为。

《弹丸论破S》GUI风格:您可以尝试以下提示: "danganronpa s, danganronpa sprite style, danganronpa S sprite style, danganronpa s gui style dialog box, Danganronpa S GUI status bar, black text, Danganronpa S GUI title bar"

服装:您可以尝试以下不同服装的提示:

连帽衫拉起的日常装: "Aiko Umesawa, yellow bunny hoodie, white button up shirt, red ribbon, light brown pleated skirt, black ankle socks, white slippers, blushing, hood up, green left eye, blue right eye"

连帽衫放下的日常装: "Aiko Umesawa, yellow bunny hoodie, white button up shirt, red ribbon, light brown pleated skirt, black ankle socks, white slippers, blushing, hood down, green left eye, blue right eye"

场景:我并未专门训练特定场景,但训练数据中出现过若干场景,您可以通过指定来自《弹丸论破》和《弹丸论破2》/《弹丸论破S》的标签来改善效果,特别是使用 'jabberwock island' 和 'Hope's Peak' 标签。我使用的是 danganronpa-gaming.proboards 地图上的场景名称。

关于她的眼睛:爱子是虹膜异色症,但生成结果有时不太稳定。如果眼睛不对,可以尝试加更多提示如:" (((heterochromia))), (((green left eye))), (((blue right eye))) "。也可以使用额外LoRA,如JujoHotaru的《虹膜异色症辅助器》(Heterochromia Helper)。不过,更大的问题似乎是不同模型对虹膜异色症的适应性不同。如果您想尝试Heterochromia Helper,请在JujoHotaru的压缩包中找到 hetechro_BG_v100.safetensors LoRA,并在提示中加入:lora:hetechro_BG_v100:1, heterochromia with blue and green。该LoRA的缺点是,蓝色/绿色往往会使“所有东西”都偏向蓝或绿——比如棕色的裙子,很可能变成绿色裙子。而且,几乎所有元素都会受这种风格“掷硬币”式的影响。

训练素材:说《弹丸论破》官方资料中关于爱子的内容极少都是轻描淡写。她只在《弹丸论破3》的一集中出现过短短一幕,粉丝创作素材也相当稀少。我截取了她出现的每一个几乎唯一的画面帧,再大量补充由madara120制作的精灵图,并最后从我其他《弹丸论破》LoRA中选取部分素材,以补充风格与场景信息。

最终思考:我最初制作Flux版LoRA本意就是一次实验——在数据极其有限的情况下,这个方法究竟能走多远?尤其是针对一个视觉特征独特、但样本极少的角色。从SD 1.5这一端的经验来看,我认识到必须在训练数据中重新调整内容来弥补缺陷。特别地,如果我重做一次,我会删掉几乎所有含文字的训练数据。因为Sprite风格的收益,远远抵不上SD 1.5因数据中频繁出现文字就认定“必须始终使用”的倾向。这就是为什么需要负面提示来避免GUI元素。和我制作的大多数LoRA一样,我已经记录下这些问题,未来会推出更新版本。不过,在我着手修订之前,还有大量角色等待制作!

此模型生成的图像

未找到图像。