C++AravaggioV0.9 - an Answer to both Dall-E and Kandinsky 2.1
详情
下载文件
关于此版本
模型描述
编辑:在收到负面反馈后,我应明确说明,该模型并非完全基于 SD 1.5,因此需要采用不同的图像生成方法。此处链接的负向嵌入有助于使用负向提示,而该模型中准确使用负向提示相当困难。
该模型已在 Automatic1111 上测试。
如果你在生成图像时遇到问题——如果图像效果很差——可能是你的显卡问题(将随机数生成器设为 CPU)。
另一个技巧是:将 ENSD 设置为 99999 比 31337 效果更好,你可以自己尝试验证。
如果你无论如何都无法复现图像效果,即使使用了嵌入,也可以尝试从示例图像中复制相关信息,这可能会有帮助。
/model/93766/embeddings-pack-for-caravaggio-reupload-with-images
该模型并不完美,我对此非常清楚。这是我现在正在开发的模型的第一步,但我暂时还不想发布它。不过,它仍具备强大的能力。
(内置 VAE,模型附带一些文本反转嵌入,分辨率为 768x768)
制作该模型的流程首先是进行若干模型合并,然后我使用自己的部分黑白素描/草图对一个基础的 1.5 模型进行了微调(我本人并非专业画家,但效果非常好,因为它以一种很自然的方式吸收了风格,使生成的人形图像与动漫风格和半写实风格模型都有显著区别)。
接着,我把微调后的模型再次与原模型合并,然后使用 Kohya 的 extract diffusers 工具对该最终模型进行拆解……为什么?因为 Stable Diffusion 基础文本编码器之外还有更好的编码器!实际上,我从 Huggingface 上搜集并逐一测试了多个编码器,以找到兼容性最佳的。现在,该模型能较好地理解结构化的英文,你可以轻松让 ChatGPT 生成一段故事,然后用它来生成图像,或者直接复制你的 Midjourney 提示词——效果不错,但显然还不是 Midjourney。



















