SomniumSC
详情
下载文件
关于此版本
模型描述
Cascade 上首个高品质动漫风格模型现已上线。SomniumSC 的目标是成为 Stable Cascade 的“老婆扩散模型”。Diffuser 版本也可在我们的 huggingface 上找到。
在 CivitAI 上,有两个文件,分别对应微调后的 Stage C 权重和微调后的文本编码器(位于 zip 文件中)。您应下载这两个文件,并解压 zip 文件以获取 .safetensors 文件,以便在 ComfyUI 中使用模型,具体操作说明如下。如果您想在 diffusers 🧨 中使用我们的模型,请查看我们在 huggingface 上的仓库,那里有如何使用的代码。
告别负面提示中的“无意义词堆砌”和繁琐的标注。从 SomniumSC v1.1 开始,您无需任何提示调整即可生成惊艳图像,标注也变得简单得多。即使不使用负面提示,我们的模型也能生成优质图像。仅当图像中出现不想要的元素(如精灵耳、随机光晕)时,才建议使用负面提示。
您可以通过 Ko-Fi 支持我。
SomniumSC 是基于 StabilityAI 全新模型 Stable Cascade(或称 Würstchen v3)微调而成,采用 2D(卡通)风格,在 36 亿参数的 Stage C 模型上进行训练。该模型同时训练了文本编码器以生成 2D 风格,因此不仅支持使用 booru 标签提示,还能使用自然语言提示。
该模型使用的数据集数量和方法与 AnySomniumXL v2 相同,后者从数十万张来自不同来源的图像中精选了 33,000 多张。数据集构建标准为:保留美学评分至少为 19、最高不超过 50 的图像(以维持卡通风格而非过于写实,评分基于我们专有的美学评分机制),且不含文字或水印(如签名、漫画/动漫图像)。因此,美学评分低于 17 或高于 50 的图像,以及含水印或文字的图像,均会被剔除。
SomniumSC 技术规格:
- 每个 Epoch 训练 40 次(SomniumSC 使用 Epoch 40 的结果)
- 由专有多模态大语言模型标注,优于 LLaVA
- 训练使用 1024x1024 和 1536x1536 多分辨率桶尺寸
- 打乱标注:是
- Clip Skip:0
- 使用 1 块 NVIDIA A100 80GB 进行训练
该数据集的构建技术结合了 CLIP 模型与 christophschuhmann 提出的 MLP 评分方法,并由我们进行改进,使用 VIT-L/14 在 -1 至 100 范围内生成美学评分,并加入我们自研的水印检测模块。
SomniumSC v1.1 的成就:
✓ 默认使用自然语言即可生成更多 2D 风格图像,无需过度依赖负面或正面提示
✓ 比平均 Stable Diffusion 模型更可能生成更优的手指,无需使用 adetailer 或修复功能
✓ 无需添加 realistic 等负面提示,即可生成更真实的 2D 风格
✓ 不会生成带有随机水印或文字的图像
✓ 文本生成能力甚至优于 AnySomniumXL v3.5.1
✓ 告别“负面提示”。除非出现不想要的物体,否则无需使用负面提示来避免生成劣质图像
✓ 比 SomniumSC v1 生成更优色彩
✓ 标注过程大大简化
与基于 SDXL 的模型相比,Stable Cascade 模型在生成手指、手部、脚部、角色细节、持物表现上更优,且可生成高达 1536px 的图像。若您敢于尝试,甚至可生成高达 2048px 的图像。
局限性:
✓ 仍需更广泛的数据集训练以提升姿势与风格的多样性
✓ 文本最多仅支持 2 个单词
✓ 该模型针对人类或变异人类优化,非人类对象(如 SCP、小马等)可能无法达到预期效果
✓ 人脸可能略显压缩。建议使用 1536px 分辨率生成以获得更清晰面部
更小的半尺寸版本与 Stable Cascade Lite 版本即将发布。
如何使用 SomniumSC:
目前 Stable Cascade 仅支持 ComfyUI,但您也可以使用我们的演示。
为简化下载流程,我将直接提供模型下载地址:
Stage A:可从 这里 下载
Stage B:可从 这里 下载
Stage C:可从 CivitAI 或我们的 huggingface 仓库下载 .safetensors 文件
文本编码器:请从我们的 huggingface 仓库 下载
SomniumSC 高级技巧:
若模型生成尖耳朵,请添加 elf 或 pointy ears。
若模型生成“压缩人脸”,请使用 1536px 分辨率,以便模型更清晰地生成面部。
免责声明:
本模型依据 STABILITY AI 非商业研究社区许可证发布。本模型不得用于销售,其衍生作品亦不得商业化。据我所知,您可通过 此处 购买 StabilityAI 会员资格,以实现基于本模型的衍生作品商业化。请支持 StabilityAI,以便他们持续为我们提供开源模型。但您仍可自由合并我们的模型。





