Rite of Wrong

详情

模型描述

这个LoRA旨在成为一个多功能的构建引擎,偏向未来主义、电子风格和(某种)朋克类型,但你会发现它也能轻松生成真实图像,甚至能清理ZIT产生的模糊感——而这正是ZIT的独特魅力所在(尽管我不确定其他人是否也有同样的体验,但我经常使用另一个LoRA来平滑ZIT的原始输出)。

不过,我要坦率地说一件事:我花了整整一周的时间,试图创建一个专为增强人类设计的“机械”构建套件,但在三次尝试、数万步训练、多次细化、添加额外图像并清理产生身体恐怖( nudity 似乎会打乱其平衡)的图像之后,它仍然无法达到我预期的效果。最终我意识到,这个模型根本无法实现我当初设想的“魔法”。但它对我而言实在太有价值了,我舍不得丢弃。于是,我调整了期望,尝试了不同风格,结果发现它不仅有价值,而且实际上正是我未来某天希望学会生成的东西——当我更深入理解这些技术时。

在我不断添加主题、修正措施和修剪数据集的过程中,我找到了一个朝着特定目标收敛的转折点,但仅仅再训练约500步后,它就崩溃了。因此,虽然我知道必须将它引向另一个方向——更具体地说,我必须根据它的实际能力来给它命名——但我仍希望它保留我最初试图构建的LoRA的一些特征。我有三个不可或缺的核心特征: humanoid 机械必须拥有大而圆的肩部护甲、昆虫类细节,并且手臂尺寸与其身体比例必须不协调。

为实现这一目标,我保留了产生过渡的15k步训练结果——若非我另辟蹊径,这些步骤本会导致收敛崩溃——并以此为基础,通过658张图像引入了16种鲜明的风格与类型特征,目标涵盖以下领域:

赛博朋克
蒸汽朋克
柴油朋克
太空朋克
生化人
19世纪—维多利亚风格
旧西部
未来主义
英雄(通用)
工业机器人(骨架)
昆虫
机器人(人形)
环境(各类建筑、室内、主题)
服饰(服装、时尚、风格)
人物—杂项(各种情境与环境中的男女)
电子设备(元件、电路板、主板、迷你板等)

在为原始主题构建数据集时,我始终以“构建”为出发点,确保不同特征之间能相互调用。这可能难以描述,但你可以想象:动物可能存在于模型的某一区域,而人类则存在于另一区域。这些区域可视为“聚类”,若聚类间存在关联,调用不同聚类的特征时就能构建出更多样化的组合。为了在这些聚类间建立桥梁,我在图像中加入了原本属于不同聚类的无关元素,从而将它们“联姻”,让一个聚类的特性得以融入另一个聚类。例如,我的一个目标就是将昆虫的细节大量注入人类、生化人和机械中,利用提示词作为构建工具,创造出高度精密的人形机械。我称之为“锚定”。

我之前提到过“锚定”,而我认为这是该实现最强大的地方。通过引用上述任何已知特征,我们似乎能深入神经网络,提取出模型在训练时已掌握的特性,其清晰度与原始训练时相当,而我们的LoRA并不会覆盖已有内容,而是以多种方式对其进行增强——这种增强在前后对比中尤为明显。

所有训练图像均不含情色互动或露骨内容。如前所述,我已移除所有裸露图像——这可能在你使用其他LoRA补充缺失细节时,对“锚定”产生一定干扰。

在我看来,模型生成的身体恐怖和缺失主题的极低质量,源于刻意的路径损伤:因为我们无法加入这些内容,模型中没有对应的聚类容纳它们,或那些被识别为容纳此类内容的聚类,已被100%的“牛肉块”填满。我不指望Z-Image-Omni现身时我们会更自由,但多亏了Lodestone,我们根本无需在意它。

如果我们任由这种趋势继续,你将需要一个LLM来盯着你,告诉你头发是否梳好了——因为你的镜子会显示一个覆盖你面部反射的叠加层,用红色警告语安慰你:“检测到真实人类,安全措施已启动!”

此模型生成的图像

未找到图像。