meishi-pix2realistic-f1kontext-lora

详情

模型描述

我的主要关注点是将复古游戏中的像素艺术转化为写实渲染。我尚未测试其他类型的像素艺术(我的训练集完全由复古游戏和我自己的粉丝艺术组成)。我的目标是尽可能忠实地再现原始图像的外观与氛围,同时保持写实风格(当然,这只是我个人的观点)。以《指挥官》(Arcade游戏)中的卡罗尔为例:她兼具美丽、性感与健美的体魄,这并非简单地给一个写实角色穿上比基尼或皮夹克就能实现的。

如今,借助Kontext的卓越能力与LoRa的微调,我们能完成这项任务的70%-90%。目前,要创作出(我认为)优秀的写实粉丝艺术,仍需进行10%-30%的手动调整。

尽管上图已相当直观,我仍提供几点澄清说明。

原始图像的透明通道在索引颜色中为紫色,因此Kontext图像呈现出略微写实且似玩偶般的质感。此LoRa会努力遵循原始图像的配色方案,即使这些颜色看起来并不自然。

即使原始图像仅为58x72像素,此LoRa仍能产生良好效果(与使用LoRa相比,对原始图像进行上采样的影响显著)。然而,若可能的话,将原始图像上采样至约512像素将获得更佳效果,且效果将非常明显。

所谓“先转换为RGB,再进行上采样”,是指原始图像为8位像素图像,且默认上采样选项为“保留细节(上采样)”。此上采样无需专门步骤,只需在工作流中添加一个节点即可。

所谓“先上采样,再转换为RGB”得到的效果与“最近邻(硬边)”方法相同,而此上采样方法能产生最佳结果。(此结果高度依赖于训练数据集,可能不适用于他人训练的LoRa,请注意这一点。)

此模型生成的图像

未找到图像。