Pirates!

详情

下载文件

模型描述

进行中。我对当前的海盗模型非常不满意,推理结果总是包含漫画风格的骷髅和交叉骨头图案戴在帽子上,而且三角帽看起来总是不对。因此,我试图创建更具审美价值的海盗模型。我在此发布四个版本及其对应的数据集,希望有人能给我一些指导,帮助我更好地刻画细节,比如弯刀的形状、三角帽或双角帽的轮廓。

版本1

第一个出炉。有点太约翰尼·德普了,你懂我的意思吧。不过它仍能稳定地生成可信的船长、副手和女性海盗形象。我犯了个错误,用维度9和alpha值1进行了训练,但我喜欢这个结果。未来我打算尝试更低的维度和alpha值。它使用触发关键词 p1r4t3s,但你也可以省略它以获得不同效果。其他关键词包括“captain”(船长)、“mate”(副手)和“female”(女性)。别在提示中使用“pirate”这个词,否则你会得到一堆来自基础模型的傻气又俗气的海盗服装垃圾。

版本2

将网络alpha和维度提升到128,但对数据集中的描述或权重几乎没有做任何调整。触发词和关键词与版本1相同。我还把clip skip改为2,只是想看看会发生什么。

版本3

将网络维度和alpha降低到16,并将clip skip改为2。我对数据集进行了大量重新加权,大幅降低了约翰尼·德普的权重,同时提高了女性图像的权重,尤其是《黑帆》中的安妮·博尼角色。这显著提升了生成图像的原创性。

版本4

保持维度和alpha为16,clip skip为2,并向数据集中添加了大量关于特定物品的图像,例如三角帽、弯刀、双角帽和软帽。我希望通过更丰富的这些细节数据,能获得更优的推理结果。但我不确定是否真的达到了预期效果。本版本的学习率比之前版本低得多,但我没有看到明显差异。我注意到一点:我在数据集中添加的那些物品,在推理结果中是以它们在训练图像中出现的尺寸呈现的,而不是与整体场景协调的尺寸。也许我应该在训练集中将这些物品的图像比例调小一些,使它们在最终生成的图像中看起来大小更自然。

此模型生成的图像

未找到图像。