CounterSushi - Stable Cascade

详情

模型描述

这是针对动漫风格的 Stable Cascade(Stage_C Lite)的微调模型。

我的目标是实现类似于 Counterfeit 和 Darksushi 的风格,适用于 Stable Cascade。

训练时我参考了 GitHub 上的 这个项目

v0.1:

我使用来自 Counterfeit 的约 300 张图像训练了 5000 步,然后又使用我之前制作的一个自定义合并模型的约 350 张图像继续训练了 5000 步。

v0.2:

使用更多图像(约 750 张)进行训练。

推荐用于更好画质的设置:使用 compression=32。

负面提示:

低质量、写实 —— 有时会让图像变差,有时却有帮助;

糟糕的解剖结构、变形 —— 通常有帮助。

正面提示:我在触发词中公布了训练时使用的提示模板,但你可以随意尝试任何提示(废话)。

NSFW:请不要尝试生成 NSFW 内容。我虽然用了约 100 张 NSFW 图像训练,但效果很差,我未来会增加更多。

v0.3:

从头重新训练。

我目前的实验设置:

cfg:2-2.5 效果不错;

Stage_B 使用 5 步,如需更多细节可增至 10 步。

负面提示:

cartoon, closeup, lowres, simple background, artifacts, (realism, blurred:1.2)

(比没有好,但欢迎尝试其他负面提示)

在负面提示中加入 "cartoon" 似乎能为图像增加更多细节。

4k、masterpiece、high quality 并不能让图像更好。

compression=42 效果不错。

如果希望角色看起来更男性化,可在负面提示中加入 "1girl, girl",可能有帮助。

重新训练数据:

1024x1024 图像 1000 张,训练 15k 步;

1024x1792 图像 650 张,训练 7k 步;

1536x1024 图像 328 张,训练 5k 步;

1024x1280 图像 129 张,训练 2.5k 步(训练时缩放到 768x)。

因此,该模型可以生成不同尺寸的图像。

我对最后一组数据的设想是:当角色在整体图像中占比较小或处于远景时,模型能够知道如何生成它们(因为它见过如何在少量像素区域中描绘角色),但不确定是否真的有效。

此模型生成的图像

未找到图像。