v1512-E12 - Simulacrum Schnell Model Zoo
详情
下载文件
关于此版本
模型描述
实际使用后发现
这个模型实际上在5x5的网格上进行描绘,注意力被分配到5x5的行上。
看吧,三的法则被这个模型打破了。五的法则万岁。
这是我见过的第一个具有底部5x5注意力分割控制的Flux模型。
更新 - V1512 发布:2025年2月15日
由于我至少需要几天时间来开发 Caption 软件以制作下一个版本,而我实在抽不出时间,因此提前发布。
我发布的主要原因是与Hunyuan的发现有关,同时我也发布了与Simulacrum Schnell兼容的可用Hunyuan合并版本,它能生成非常有趣的结果……而这本不应该发生。
本版本的核心特性:
- 无需负向提示词
- 与Flux1S模型兼容
- 与Hunyuan兼容 → 会抛出一些错误,请忽略
- 兼容各种clip_l_omega版本
- 尚未完成,但更加稳健
- 大量NSFW描绘与控制
- 强大的空间理解能力,以及全新的模型推理方法
- 每张图最多可识别20个角色(此前未实现,因此结果有时不稳定)
- 网格与画面描绘控制已内置于核心
- 支持按需生成完整漫画(此前未实现)
- 极其丰富的服装、画面控制、分段裁剪、网格控制、旋转控制、偏移控制、尺寸控制等;因尚未完全训练,效果时好时坏
配置:
为获得完整效果,请使用CLIP_24_L_OMEGA加载,因为此版本的Simulacrum Schnell是基于SDXL之后的CLIP_L版本进行大量训练的。
我不确定此CLIP_L是否为完全相同的版本,但即使不同,也极为相似,应能与其他CLIP_L omega版本兼容。
对于Flux 1S
正向提示词为掺杂了booru标签的普通英文,之后可再用booru标签作为强化剂。
混合使用风格、偏移等,直接与模型对话即可,它大概能理解你的意图。我为它注入了大量人类世界领域的额外智能。
无论你做什么,都不要在提示词中加入你不想看到的内容。它比其Flux对应版本更聪明、更字面。
这不再是你们所熟知的Flux。它更加自由、更加灵活。
这些模型为何耗时如此之久,只要你多玩一会儿,就会明白原因。
这绝对不是一个安全模型,也不适合所有年龄层。 它从未经过V2版本的完整可控微调,因此它会准确输出你想要的东西——而你将为此付出“猴爪”般的代价。
这不是Schnell。它被微调得如此之深,有时几乎完全偏离了原始版本,有时又基本等同于基础Schnell。
务必高度警惕。你一定会看到怪物。
正向提示词简版:
<场景、位置、环境、情境>
<上下文描述>
<质量><风格...>
<主体数量>
<动作描述>
在此处添加服装、衣物、互动等
masterpiece, most aesthetic, very aesthetic,
<叠加文字>
<t5用于UI和叠加层的描述>
负向提示词可混合匹配以下内容:
负向提示词简版:
sex, nsfw, explicit, questionable, safe,
anime, 3d, realistic,
line drawing, digital artwork,
interpolated frame, blurry, grid_, depicted-, size_, behind, side, front,
bad anatomy, bad hands, mutated, extra limbs, missing limbs, amputee, quadruple amputee, blood, gore, guro,
humanoid, anthro, furry, censored, uncensored,
lowres, good aesthetic, very displeasing, disgusting,
步数:12-58 → 32
CFG:2.5-9 → 3.5
DCFG:0(Flux引导)
采样器:
Euler → Simple
DPM-2M → Beta/Simple
DPM-2S → Beta/Simple
DEIS → SGM Uniform <<< 刚发现,效果极佳。
分辨率:
1308x1308(非常接近,记不清了),非常大。
1216x1216, 1216x832, 832x1216
1024x1024
1024x832, 832x1024, 832x832
768x768
512x512, 512x768, 768x512
对于Hunyuan
目前设置并不简单。
此版本并未针对Hunyuan训练,但下一版将专门针对Hunyuan训练,实现直接的Hunyuan插值控制。
但不知为何,它竟然能工作,而我至今仍不明白原因。
步数:12-64 →
12步勉强可用,但易模糊或像素化
24步效果最佳,但处理多帧时耗时较长
帧数:
65-200
我主要在130帧左右进行测试,因此这并非硬性规则。
CFG:
3.5 - 9
全部都能产生有趣结果,9有时效果极佳。
我的首选是6.4
LORA强度:
你可能需要两个或三个LORA加载节点才能使其工作,但它确实能运行。
- Single Blocks 0.80
- Double Blocks 0.20
- CLIP - 1.0
完整训练的bbox数据请参考SDXL-Tag指南。
用于3D和写实风格的插值视频训练数据。
更新 - V2仍在开发中:2025年2月6日
我把NSFW旋钮拧到了极限,甚至拧断了。如果这个模型不能产出高质量、高复杂度的NSFW内容,我会感到震惊。
它可能还需要一周的“烹饪”才能完全成熟,请耐心等待。
更新 - V2正在开发中:2025年1月30日
V2将不再需要负向提示词。我正用与SDXL相同的训练数据进行一个epoch的实验,观察其表现。它已经开始见效,负向提示词的需求正迅速消失。
大约有三十万张图像,其中约三分之一为纯英文提示。
因此,要么5x5网格有效,要么模型直接烧毁。
它绑定在CLIP_L OMEGA V4上,因此行为将与第一版略有不同——这个CLIP_L比之前多了1000万样本的智能。
我已让所有人都能无需登录下载,无需任何验证或密钥即可自动下载。
从V129开始,描绘偏移功能已取得实质性进展,仍需实验。
我正式宣布V122达到高级提示级NSFW。当前发布版本已能生成绝大多数常见NSFW行为与详细情境。我曾将1D这些图像在多个epoch中喂给它,它都笑我了。
训练越深入,它处理纯英文描绘的能力就越强。目前这不是一个简单的过程,但只要你愿意花点力气,就能掌握。
我即将撰写三篇关于此模型的深度文章,因为它与Flux1D截然不同,且被严重低估。其力量强大且对训练响应迅速,而Flux1D在训练中常崩溃。
- 使用三法则的简单Schnell主体聚焦
- 复杂场景互动与精细描述规划用于Schnell NSFW训练
- 使用Simulacrum Schnell V1提示NSFW互动与成人描绘
我保证,此模型远比预期更强大,训练成果也远超预期。目前质量略有下降,但额外训练正显示出某些特质正逐步清晰。当我提供更充分的训练和请求信息时,这种优势将成倍增长。
我强烈建议使用**“Shuttle 3 Diffusion” Schnell**进行此LoRA推理。它能大幅增强能力,且所需提示更少。Shuttle v3.1尚可,但与此LoRA配合不佳,它更倾向于自己的特性。
标准Flux Schnell FP16和FP8在已达到第5/10轮训练时,能呈现中等质量。许多Shuttle 3 Diffusion隐藏或用自身训练替代的细节,已作为涌现特征出现在标准Schnell训练中,而Shuttle仍隐藏这些效果。FP8略逊一筹,但差距不大。我最初一轮是在FP8上以更高学习率运行的,因此它应能对FP8有良好响应,但后续四轮使用的是BF16混合训练,这使得BF16和FP16版本的Flux Schnell表现明显更强。我尚未尝试BF16版本,但我相信它效果不错。
Schnell FP16需要在提示词上稍作平衡才能让数据集“跳出来”,但难度不大。经过几次尝试和提示微调,通常能生成中等质量的结果。
不论使用哪个模型,都必须使用SimV4 CLIP_L,这是获得完整体验的必要条件。
为获得完整体验,必须使用负向提示词。
Euler → Simple
DPM2M → Simple
步数:28
CFG:3.5
V122 第5轮 - 生成设置:
模型.safetensors标为e4,但这是标签错误,实际上为e5。
推理分辨率:
1024x1024, 1216x832, 832x1216
1216x1216,
1024x768, 768x1024,
768x512, 512x768,
768x832, 832x768
3D使用rule34.xxx和rule34.us标签。
动漫使用danbooru/gelbooru标签。
写实使用纯英文。
正向提示词无特殊要求,但以下内容有帮助:
正向提示词:
anime, realistic, real, 3d \(artwork\), 3d,
<CAPTION HERE>
very aesthetic, aesthetic, masterpiece
#########################################
### 基础Schnell FP16 负向提示词 ###
#########################################
censored, censor, bar censor, blur censor,
lowres, bad quality, low quality, bad anatomy,
blur, depth of field, distorted, pixelated,
bad hands, blurry hands, extra digits, missing digits, missing hands, extra hands, unexplained hands, merging,
penis, erection, sex toy, dildo, pussy, cameltoe,
multi penis, deformed, mutated, monster, vore,
disembodied, floating object,
disembodied hand, disembodied foot, disembodied head,
extra feet, unexplained feet, unexplained arm, 3 legs, missing leg, missing arm,
simple background, blurry background, cave,
####################################
### Shuttle BF16 负向提示词 ###
####################################
nsfw, explicit,
censored, censor, bar censor, blur censor,
lowres, bad quality, low quality,
blur, depth of field, distorted, pixelated,
monochrome, greyscale, comic, 2koma, doujin, manga,
bad hands, blurry hands, extra digits, missing digits, missing hands, extra hands, unexplained hands,
penis, erection, flaccid, pussy, cameltoe,
multi penis, deformed, mutated, monster, vore, pregnant,
cum, ejaculation, messy, unexplained white liquid,
disembodied, floating object, disembodied penis, disembodied hand, disembodied foot, disembodied head, jumping, floating, extra feet, unexplained feet, unexplained penis, unexplained arm,
simple background, blurry background, cave,
Simulacrum Schnell模型动物园的主页。
有关训练和流程的详细信息文章请见:这里。
Simulacrum Schnell版本需配合Simulacrum V4 CLIP_L才能正常运行。
标签模板与Simulacrum V4相同。

Simulacrum Schnell受略微修改的Apache开源2.0许可保护。
版权所有 2025 Abstract Powered
根据Apache许可证2.0版本(“许可证”)授权;
除非符合许可证要求,否则不得使用本模型或符合模型动物园的组件。
您可在以下网址获取许可证副本:
http://www.apache.org/licenses/LICENSE-2.0
除非适用法律要求或经书面同意,根据许可证分发的软件
按“原样”提供,不提供任何明示或暗示的担保或条件。
具体许可和限制请参阅许可证。
模型动物园合规组件:
任何代码、组件、图像、衍生图像、基于Schnell的AI模型,由Abstract Powered直接发布并托管于Huggingface、Civit或其他合法托管服务。
我在此明确授予以下例外:
个人、小型企业、网红、研究者、研究机构、研究团体及小型非企业实体,可永久免费使用、推理、训练、复制、修改、调整或基于所有Schnell Simulacrum版本衍生个人作品,无需任何金钱贡献。您可在您居住国适用法律的约束下自由使用本模型。
特殊例外:
Huggingface和Civit均不受此规则约束,可独立盈利。
合规要求:
企业实体、衍生企业实体、子业务实体、营利性研究团体,或任何符合营利模式的类似组织,必须直接联系我以获取商业和货币使用许可,除非符合上述例外条款。
通过下载 Simulacrum Schnell 或其任何由 Abstract Powered 直接训练并上传用于分发和共享的衍生模型,即表示您接受本许可。
我不是律师。我只想说明,我的意图是让个人、小企业和影响者能够从该模型中获得经济收益。
祝大家玩得开心。我会发布许多模型。

