CounterSushi - Stable Cascade
详情
下载文件
模型描述
这是针对动漫风格的 Stable Cascade(Stage_C Lite)的微调模型。
我的目标是实现类似于 Counterfeit 和 Darksushi 的风格,适用于 Stable Cascade。
训练时我参考了 GitHub 上的 这个项目。
v0.1:
我使用来自 Counterfeit 的约 300 张图像训练了 5000 步,然后又使用我之前制作的一个自定义合并模型的约 350 张图像继续训练了 5000 步。
v0.2:
使用更多图像(约 750 张)进行训练。
推荐用于更好画质的设置:使用 compression=32。
负面提示:
低质量、写实 —— 有时会让图像变差,有时却有帮助;
糟糕的解剖结构、变形 —— 通常有帮助。
正面提示:我在触发词中公布了训练时使用的提示模板,但你可以随意尝试任何提示(废话)。
NSFW:请不要尝试生成 NSFW 内容。我虽然用了约 100 张 NSFW 图像训练,但效果很差,我未来会增加更多。
v0.3:
从头重新训练。
我目前的实验设置:
cfg:2-2.5 效果不错;
Stage_B 使用 5 步,如需更多细节可增至 10 步。
负面提示:
cartoon, closeup, lowres, simple background, artifacts, (realism, blurred:1.2)
(比没有好,但欢迎尝试其他负面提示)
在负面提示中加入 "cartoon" 似乎能为图像增加更多细节。
4k、masterpiece、high quality 并不能让图像更好。
compression=42 效果不错。
如果希望角色看起来更男性化,可在负面提示中加入 "1girl, girl",可能有帮助。
重新训练数据:
1024x1024 图像 1000 张,训练 15k 步;
1024x1792 图像 650 张,训练 7k 步;
1536x1024 图像 328 张,训练 5k 步;
1024x1280 图像 129 张,训练 2.5k 步(训练时缩放到 768x)。
因此,该模型可以生成不同尺寸的图像。
我对最后一组数据的设想是:当角色在整体图像中占比较小或处于远景时,模型能够知道如何生成它们(因为它见过如何在少量像素区域中描绘角色),但不确定是否真的有效。











