Otome TEST LORA

详情

模型描述

LORA仅在Civitai向公众开放

LORAはCivitaiでのみ公開しています

TEST LORA

抱歉,我不将其翻译成英文,因为我担心自己无法察觉细微的语义差异或翻译错误。此外,由于许多用户的母语并非英语,我们希望需要日语翻译的人能自行完成。

此LORA仅为测试用途,有兴趣了解测试结果者请随意使用。

本LORA是为今后制作而进行的极端大量学习图像测试。

我正在摸索中制作LORA,但长期以来一直对“学习图像越多越好”“图像尺寸应统一”这类碎片信息感到困惑。

因此,我尝试制作了一个LORA,并使用它生成了800张1344×768尺寸统一的图像用于学习。作为测试的一部分,约80%的图像包含背景。

然而,我并未进行对比实验,比如“无背景的800张图像”或“未统一尺寸的800张图像”,也没有在1024×1024分辨率下测试。这纯粹是主观性测试,请勿抱有过高期望。

由于从零开始为不喜欢的角色制作LORA非常痛苦,我选择了我个人极度喜爱的角色——【从乙女樱木】。

樱木乙女已在Illustrious上由前辈制作了极为出色的LORA,效果极佳,我也曾用它生成多张投稿图像。

如需获取樱木乙女LORA,请访问:/model/1121521

此LORA仅为测试用途,有兴趣了解测试结果者请随意使用。

测试感想:本LORA已达到可公开的第一阶段水平。本次测试旨在使用该LORA进行统一图像大量学习的验证。我最期待的是“不良部分的平均化”效果。

老实说,变化并不显著。虽然感觉确实有所改善,但远未达到“戏剧性”的程度。若被问“是否已充分细致地比较过?”——时间上确实仍显不足。但仅从视觉上看,“发丝质感”“学习到的服装”“丰满感”等方面表现相当不错。

尽管信息有限,但我使用约8种不同发色的检查点进行测试,未出现“你是谁?”这类混乱图像,这或许已是目前最大的收益了。此外,这也是我测试前基于经验的预感——稳定性。无论姿势或表情如何变化,生成结果都相当稳定。

我的GPU是为其他用途选购的Intel ARC770 16GB,性能并不理想,速度较慢。若问“生成800张原始图像所耗费的时间成本是否值得?”——答案是否定的。

但如果你是某角色的狂热粉丝,愿意不惜一切代价追求最佳LORA,那这个做法或许值得一试。

对我来说,乙女是我最爱的角色,因此我毫无后悔!(笑)

测试的另一个目的:目前我并未在本地制作LORA。因为GPU占用时间过长,会严重影响我的工作(虽属食品行业个体经营,但高度依赖电脑,另有多台辅助设备也处于运行状态),因此在Civitai上生成更方便。

什么?“你要分清工作与私人用途”?——没错,正是如此!

但真正能如此清晰划分管理的个体经营者,早就成立公司了。个体经营的本质,就是工作与生活财务一体啊……

闲话少叙。

于是引出“Buzz消耗”问题。我当然清楚“一次成功最好”,但若原作是动画还好,我个人的动画偏好极其偏狭——说白了,我对很多作品根本不熟悉。不了解就谈不上喜欢,不喜欢的角色就无法创作(笑)。实际上,大部分原作是漫画或轻小说插图。

此外,若原作是“已阅读的漫画/小说”,数据几乎全为黑白——或者说,基本全是黑白(汗)。

因此,几乎不可能一次成功,更多时候是“色彩印象不符”。(哪怕仅有一张彩色图,通常也基本没问题)以色彩为例,漫画中常缺乏全身照、背面照、坐姿图(连动画里也常缺),导致“风格违和”问题频现。

于是,不得不反复调整同一个LORA,进行第二轮、第三轮。(是的,我知道这太费劲了。)

结果:Buzz再怎么多也不够!^^;

三轮测试(最少)需消耗1500 Buzz……但通常无法在最低消耗下结束。

因此我心想:“无论如何,得想办法在两轮内完成!”——这正是本次测试的动机。

本次(首次生成:500 Buzz)
以首次结果为基础调整提示词,提示词无法修正的部分用Photoshop处理,最终获得约800张数据(第二轮使用这800张数据生成LORA,花费约1000 Buzz)……咦?意外地便宜嘛,喂。

总之,本次两轮就完成了,Buzz消耗还算满意。

800张图像使用通配符批量生成,完全放任不管,比起制作LORA,省去了不少手工操作。

或许这次的效果稍好一点点?……仅此而已。若加上标签编辑时间,收益就非常显著了。虽然图像数量多,但通配符也实现了模式化。

欢迎大家提供你们生成的图像——不论是“怎么变成这样了?”还是“不错嘛!”——不论风格或结果,只要能作为参考,我都非常感激。(请注意:新规则下,如穿戴尿布、醉酒、持枪威胁、催眠等未经同意的场景图片是完全禁止的。)

顺便说,封面(即LORA缩略图)中的图像中标注为“R”。原本想表现“运动员清爽补水”的场景,结果被判定为R——啊,太色情了!太不像话了!原来如此(笑)。

敬请畅所欲言,不吝赐教。

测试环节

或许对大家有些帮助?我借此机会顺便测试了新规则下Clavata的判断倾向。虽然测试内容简单,但总比什么都不做强,仅供大家参考。

请注意,所有图像主题均为体育运动,本应属于SFW(安全内容)。以下是每张图的评级标注:

1.(补水:R)
可能提示词有问题?为表现运动后恍惚感用了"in heat",或许是触发了判定?

2.(瑜伽:R)
我参考了现实中女性练习瑜伽的穿着,却被标为R。瑜伽竟成了“成人向主题或情境”???
我原以为瑜伽理所当然是健康向的,实在难以理解。

3.(拳击:PG)
图片别名为“邓普西滚”(Dempsey Roll,一种拳击动作)(笑)。体育运动中本就包含暴力元素,借此测试。结果为SFW,可能是因为拳套遮住了胸部?

4.(冲浪:R)
女性冲浪者的常见穿着却被判为不健康。或许只是简单的过时判断:是否与皮肤裸露面积有关?这显然不该是AI的工作,但愿不是这样。

5.(远距离射击:PG)
皮肤裸露少,但因使用枪械,易被视为暴力场景。本图中人物并未瞄准,甚至未持枪,结果仍为SFW。AI没陷入歇斯底里,让我稍感安心。
顺便一提,我原想做“飞碟射击”(在日本,从霰弹枪持证满10年才可申请步枪,因此至少28岁。但乙女看起来明显不到28岁),结果生成的双管霰弹枪上下排列无法实现。甚至水平排列也失败。虽然泵动或气动也可用于竞技,但弹药装填状态从远处难以辨认,因此不受欢迎,部分地区甚至反感。我突然想做霰弹枪LORA了……

6.(网球:R)
是胸部吗?!是胸部导致的吗?!莫非真是皮肤裸露面积的问题?唉,失望。

7.(篮球:PG)
不是胸部?那……啊!难道AI把胸部看成篮球了?!
AI是不是在想:“三个乳头?或许有这种人类?万一被认定为歧视就麻烦了。”——厉害啊,AI。像《全面回忆》里的变异人一样。保罗·范霍文看了都要震惊(笑)。
皮肤裸露面积说的可信度又上升了……人类眼中是健康的性感,但AI可能觉得不对劲。或许是美国公司对篮球更宽容?如果是穿 Polo 衫,会不会直接被骂“太不正经”?(笑)

8.(划船:PG13)
啥?PG13:“穿着暴露”?短裤怎么就不行了?
还是皮肤裸露面积的问题?如果涂满金粉表演,全裸会不会变成SFW?

9.(跳伞:PG)
合理,SFW。“只要本人自愿承担风险,当局不会干涉其行为”——大概是这个逻辑吧。

10.(骑马,幼马鞍具训练:PG)
并非刻意设计,纯属偶然,却是我个人最满意的一张图。原本只是想生成普通骑马场景,但所有检查点生成的马都显得太小。反复生成后,终于出现了理想画面。这匹马比幼马大得多,但或许因训练延迟才显得如此?画面中,人正与马并肩行走,轻声鼓励:“一、二、一、二,别怕,做得好,真聪明!”——这种训练女性确实更擅长,也让我感受到女性的温柔力量。

马的毛色是褐色(或接近褐色),但AI显然能区分马和人。看来并非仅靠皮肤裸露面积判定,这点让我安心了。

此模型生成的图像

未找到图像。