Classic Negative (SD 2.1 768px)

详情

模型描述

2023年2月2日

经典负面模型(SD 2.1 768px v0.2)

我终于成功训练出适用于 SD 2.1 768 的改进版原始经典负面模型。

改进主要来自于更优质且更准确的标签描述,以及更丰富的数据集。我还使用了部分用原始版本生成的图片进行训练。

我附上了默认 2.1 模型、v0.1 和 v0.2 之间的对比图,用以评估其是否真正有所提升。与默认模型相比,它在光照、色彩搭配、景深和构图方面均有显著改善。相比 v0.1 版本,v0.2 在景深过渡上更加顺滑,并生成了更接近现实的图像。整体色彩也更贴合我最初的设计意图。

2023年1月15日

- 更新 -

经过多次尝试失败后,我终于成功使用与 1.5 版经典负面模型相同的数据集,训练出了可用的 2.1 版本。我很遗憾没能展示更多样化的图片,因为我正忙于一张又一张地创作可爱的小动物。

  • 对于 2:3 画面比例的图像,1152x768px 的尺寸效果极佳

  • 对于 21:9 画面比例的图像,1344x576px 的尺寸效果极佳

请确保将配置文件放入与模型相同的文件夹中,并且文件名必须完全一致。

2023年1月13日

- 原始发布 -

首先声明,我本人其实并不清楚自己在做什么。此外,这绝不是一个完整或完美的模型。但在多次尝试之后,我终于到了一个可以分享部分图像以及早期版本供你们试用的阶段。

经典负面模型(SD 1.5)

在“经典负面模型”中,我尝试使用 DreamBooth 训练一个模型,使其尽可能贴近我的摄影风格。“经典负面”这个名字源于富士相机内置的一种胶片模式——“经典负片”。我在几乎所有照片中都使用了该模式的修改版。为了模仿我的风格,该模型需达到以下效果:

  • 再现经典负片的色彩风格:柔和而低饱和度的绿色

  • 实现褪色的黑色与扩散的高光(类似 Tiffen Glimmerglass 滤镜的效果)

  • 稳定地生成如大光圈镜头般自然的景深效果

  • 改善默认模型的构图(前景与背景物体布局、取景方式、视角)

  • 改善默认模型的光照表现

  • 加入颗粒感,并理想情况下配以轻微的暗角

  • 尽可能还原老式 35mm 胶片照片的视觉质感与氛围

训练过程

训练所用的数据为我本人拍摄的 100 张照片,主要包含环境人像、狗的照片、部分微距与风景照。该模型可能偏向森林与庭院类图像,因为我大多数照片都拍摄于此。从生成的图片中可明显看出我的后院结构,模型似乎已接近过拟合。

所有照片的标签均由人工编写,内容并不复杂。例如:https://i.imgur.com/prf8VxS.png

我使用 TheLastBen 的 Fast DreamBooth ipynb 文件,以 1e-5 的学习率训练了 1800 步,同时设置文本编码器为 350 步。

提示词与参数设置

目前我尝试的提示词都很简单,激活词为 classicnegative:

- classicnegative 一只可爱的浣熊坐在花园灌木丛间,紫色郁金香花

- classicnegative 一只可爱的小红熊猫坐在丛林的树枝上

- classicnegative 一只白色蓬松的兔子站在花园中,被仙女灯照亮,冬日,大雪,雪花飘落

参数设置:Euler A,CFG Scale 7,30 步,860x360px

随后我进行了种子筛选(seed hunting)。尽管在每批 4 张图片中,至少能有一张可用。若生成了满意图像,我将使用相同种子,启用 Hires. fix 再次生成(在我的 GTX 1070 上,单图处理约需 3.5 分钟)。

Hires. fix 参数:ESRGAN_4x,30 步,0.3 去噪,放大 2 倍

这是一个偶然发现:使用此设置时,图像保持完全一致,所有胶片质感(如颗粒)在放大过程中都不会丢失。

如果模型效果过强,可在提示词中加入 sharp focus、high contrast、clarity 等关键词,或在后期适当提高对比度。不过确实偶尔会过强,我将在后续版本中加以调整。

后续计划

  • 需要进行更多测试,尝试不同参数与主题

  • 创建 SD2.1 768px 版本

  • 模型微调

欢迎你们试用此模型,测试其极限。若你有任何建议或想法,能让该模型更进一步,请随时告诉我!

此模型生成的图像

未找到图像。