LomoXL

详情

下载文件

模型描述

LomoXL


与 SD1.5 的 LomoStyle 类似;LomoXL 是在使用模拟设备拍摄的图像数据集上训练而成。


特性

  1. 高分辨率图像:在 1024x1024 的图像上训练(XL 默认分辨率),经人工标注和裁剪以获得最佳输出效果。

  2. 照片真实感:尽管与 SD1.5 相比仍有所欠缺,但本模型在数据选择、处理、标注和训练参数等方面均致力于生成更真实的照片级图像。

  3. 全参数微调:这是对原始 SDXL 基础模型 1.0 的全参数微调。训练过程中同时调整了 U-Net 和两个文本编码器。


局限性

遗憾的是,LomoXL 继承了原始 SDXL 模型的部分局限性。尽管在照片真实感方面有所改进,但仍无法与 SD1.5 模型相媲美,尤其是在皮肤纹理和裸露内容方面。虽然可生成 NSFW 内容,但效果并不理想。为解决此问题,我建议暂时使用额外的网络(如 LoRA 和文本反转)作为过渡方案,直至 SDXL 基础模型经过充分训练克服这一瓶颈。


使用方法

VAE - https://huggingface.co/madebyollin/sdxl-vae-fp16-fix

+ 提示词:自然语言提示,可额外添加两个特殊标签:

  • lomostyle:可在提示词开头添加的前缀。
  • in lomostyle:可在提示词末尾添加的后缀。

注意:这些标记非必需。

有关可与 LomoXL 一起使用的其他特殊标记(标签)的更多信息,请参阅 Lomostyle

- 反向提示词:我尚不确定最佳组合,但我主要使用以下反向提示词:

  • kid, child, 3D render, cartoon, watermark, text, signature, distorted, bad, exaggerated limbs, fake

当然,您也可以自由尝试其他反向标记。通常来说,在扩散模型中,“越少越好”。


问题/反馈/更新?

访问我在 Unstable Diffusion Discord 中的帖子


未来的更新已在进行中,旨在将 SDXL 提升至甚至超越 SD1.5 的水平。如果您希望参与贡献,请通过上述 Discord 帖子私信我。


查看我的其他模型

SDXL

SD1.5

LoRA

此模型生成的图像

未找到图像。