DOS EGA Style

详情

下载文件

模型描述

V2 备注

训练这个模型更加地狱(我大概做了十次不同成功率的中间实验),但现在结果稳定多了。顺带一提,我甚至自己写了一个标签管理器,只为缓解打标签带来的挫败感。一些随机笔记:

  • 我移除了所有包含玩家角色图像的冒险游戏图片,因为我发现模型太沉迷于生成微小的人物了,因此所有风景图现在都仅保留风景本身。

  • 增加了更多样化的数据源,不仅限于 Sierra 和 LucasArts 的游戏,但保持了相似的艺术风格。

  • 移除了大量高度抖动的图像(尤其指向 KQ1 EGA 重制版),因为我认为这干扰了训练。

  • 所有图像均归一化为 1280x768(因分桶机制,而非 1280x800),虽不完美,但已足够好,并让像素更加突出。

  • 修复了一些颜色偏移的 EGA 调色板图像,现在所有图像都使用正确的 CGA/EGA 16 色彩调色板。

  • 所有图像均放大 400%,因此不存在异常波动。

  • 虽然我喜欢 LSL3 的角色特写,但其中一些使用了黄/紫抖动来制造“更好”的肤色,我认为这与“红色皮肤”冲突,因此我将它们从数据集中移除了。

我从具有红色肤色的角色图片中移除了“red skin”和“colored skin”标签,以使模型在生成这类红色肤色角色时更加一致。

此 LoRA 的检查点相当敏感。 如果某个检查点效果不佳,请尝试另一个。高度动漫化风格的检查点倾向于产生更“褪色”的柔和色彩,专为像素艺术调优的检查点则倾向于强加自己的风格,通常具有“更粗犷”的分辨率。奇怪的是,许多写实风格的检查点表现不错,可能是由于更高的对比度更容易被映射出来——但若太过写实,你会得到龙虾人。

质量提示词(正向和负向)可能重要,也可能不重要。尝试使用和不使用它们,你需要自行实验找到最佳组合。

加分项:推荐使用 “SD-Palettize” 脚本扩展。部分图库图像使用此脚本强制渲染为准确配色。设置:为其创建一个 CGA/EGA 调色板,然后设置 16 种颜色,缩放比例设为 4(因图像已 400% 放大),并添加 Bayer 2x2 滤镜,参数设为 2 或 3。


V1 备注

训练这个模型非常困难,远谈不上可靠。触发词也有些挑剔。有时 pixel art 有帮助,有时却无效。你需要多做实验。如果你想获得令人愉悦的肤色,我推荐使用 red skin

找到优质的 16 色 EGA 艺术素材花费了我大量时间,从老 DOS 游戏中提取图像。我认为像素艺术被缩放到太多略微不同的分桶尺寸,导致模型无法一致地识别抖动色块,反而将它们混合成我们“感知”到的抖动效果。不过,你仍能获得大致接近 EGA 风格的还原——它基本抓住了整体轮廓,像一段模糊的 1980 年代记忆。我想这倒很合适。那个时代的数字艺术家是真正的魔术师,能把这些糟糕的色彩变成任何东西,而非电气工程师随意挑出的色块。如今的复古艺术家也一样,他们主动选择使用这种可憎的配色方案。

我觉得,如果这个 LoRA 训练时间再长一点,我对训练图像再做更多调整,并找到更好的方法让像素尺寸与分桶大小匹配,从而在各分桶内保持缩放一致性……效果可能会更好些。但这听起来像苦工。或许将其与像素艺术 LoRA 或检查点结合,能获得有用的结果……也可能不会。

随机闲谈

从技术上讲,这是 CGA 的 16 色集,但我想大多数还记得那个年代的人,都会把 CGA 和它更受限的四色调色板联系起来。直到昂贵的 EGA 卡出现后,才在 320x200 模式下能完整使用全部 16 种 CGA 色彩。据我了解,EGA 理论上可以从 64 色调色板中选择 16 色,但仅限于 640x350 分辨率。320x200 模式使用的是 CGA 兼容调色板,这是由显示器信号要求决定的。EGA 卡本身也相当缓慢。颇具讽刺意味的是,直到 VGA 出现,我们今天所熟知的 EGA 风格才变得既经济又普及,使其存在时间非常短暂。

此模型生成的图像

未找到图像。