🎟️ FUSIONCORE | qp

详情

模型描述

该模型已不再更新。请查看我的 QuadPipe SDXL 模型,它在此基础上继续发展。我会在 Civitai 上保留此模型,供仍喜爱使用 SD1.5 的用户使用——但请不要期待未来有任何 SD1.5 的更新。

谢谢!
-qp

--EOL 通知--

这绝对是预测试版!哈哈!
有一个小提示:当你查看这里生成的图像时,MarvinAI-SynFlow 是我开发时的原名,上传前我改成了 Fusioncore。我本想更新图片以反映新名称,因为模型完全相同,但我搞不懂怎么编辑模型页面上的图片(是吧?……工程师也搞不定工程。唉……)无论如何,这是我第一个公开分享的模型,上传到这里就是为了学习。

捐赠:https://www.buymeacoffee.com/quadpipe

我的背景是产品设计与工程。我曾供职于 MIT 和梦工厂,几年来一直在接触 AI,但今年是我第一次深入模型创作。这并不意味着我比别人更擅长,但或许能帮助你理解我为何采用这样的工作方式。无论如何,我非常欣赏大家所做的工作,并希望能贡献一些价值。

我总是注意到,无论许多照片级图像渲染得多好,它们往往缺少某种“人性”的特质。人类的本质很难仅靠堆砌高质量照片到训练流程中来捕捉。因此,我将训练重点放在那些既捕捉了情感、又遵循摄影原则的照片上。我希望模型在面对提示中的场景描述时,能更容易“领悟”到这种本质。目前,这些提示词可能偏重,虽然它在轻量级负向提示上表现不错,但使用他人测试过的效果是验证我们成果的好方法。因此,示例图像中的提示词可能比实际需要的更重——事实上确实很重,但其实不必如此。请尽情实验,并告诉我你的发现。

我的图像大多使用了大量采样步数,但你不需要。我故意使用很多步数,以观察需要多少步才会出现严重的“烧屏”问题。我在 30–50 步范围内取得了相当好的效果,许多照片在 512x768 分辨率下无需放大就已非常出色。这些图像大多被放大了 2 倍。我经常使用 DDIM,但 Euler 及其他采样器也表现良好。需要说明的是,Epochs 和 Steps 没有列出,是因为这里合并了大量模型,此外其中还有一些“秘方”。

一旦我觉得这可以作为稳定的 1.0 版本,我会尝试将所学应用到 SDXL 模型上——但这可能还需要一段时间,因为我还不确定是否只需简单放大现有内容,还是必须重新生成大量图像以构建训练数据。

那么,我是如何着手的?

我创建了大约 18 个专注于我认为恰当的摄影元素的模型。例如,我创建了一个名为“沉思”的模型,专门捕捉人们深度思考时的照片,聚焦于情感与人性的本质。

在创建完这些模型后,我将它们与 SD1.5 基础模型合并,持续测试和调整了数月。在此过程中,我会根据生成的成功图像开发新的子模型来修正问题。我试图摆脱继承衍生问题(仍在努力中),因此仅使用其他模型生成的图像,而非直接合并。像其他人一样,手部仍是挑战,我仍在努力改进。

如果你希望看到我继续做更多,我会尽全力。我非常感激任何捐赠,这对我意义重大。谢谢。(我也会把这句话放在底部,或许能稍微提升一些机会)

捐赠:https://www.buymeacoffee.com/quadpipe

以下这些模型启发了我,我偶尔会使用它们生成的图像来构建我的训练数据:

Analog Diffusion by wavymulder
AbsoluteReality by Lykon
CyberRealistic by Cyberdelia
Analog Madness by CornmeisterNL
A-Zovya Photoreal by Zovya
epiCRealism by epinikion
Juggernaut by KandooAI

此模型生成的图像

未找到图像。