Cartunafied
详情
下载文件
关于此版本
模型描述
“我们就像站在巨人肩上的矮子。我们能看得更远、看得更清晰,不是因为我们的视力比他们好,也不是因为我们比他们高,而是因为他们把我们举得更高,凭借他们伟大的身姿,使我们的视野也得到了拓展。”——约翰·萨利斯伯里
感谢 CivitAI 提供这一创作空间,也感谢那些不断追求更高完美境界的社区成员们。
V4 说明:
以 Tuna v3 为基础,我采用了合并块加权(MBW)并经过大量试错调整,因此向各位参数研究者致歉——即便我想解释清楚,也无法精确描述具体操作方式。我使用了 A1111 的 SuperMerger 扩展插件,强烈推荐大家使用它来学习 MBW 的工作原理,而不会大量占用存储空间。
特别感谢 UmiAI 创作者及其团队模型混合器提供的指导与数据支持(已在前文链接)。本次混合作中所用的所有模型均已提供链接,部分模型已更新,还有一些是经过明确授权使用的私密模型。
那么,有哪些变化?整体构图更加自由奔放,同时对提示词的响应也更加灵敏。我建议使用短语与简短关键词列表的组合方式。不要过度使用,尤其避免在负面提示中堆砌过多词汇。手部表现略有提升。眼睛与面部细节更具风格化,减少“动漫脸”倾向。服装及其他内部结构、阴影与光照效果更加精细。模型词汇量也得到了显著扩展。
我对风格偏好的目标已基本实现,同时保持了较强的风格灵活性。若无特定提示,该模型默认生成浅肤色女性、适度裸露,并呈现出融合“东西方动漫和卡通”最佳特征的较强轮廓风格。
V3 说明:
v3:啊,我的缪斯,我终于找到你了。多样的肤色表现,引人注目的背景与细节,手部表现更为稳定可靠,生殖器部分更干净整洁。对提示词的响应更加灵敏,受 Loras 影响程度与 v2 基本相当。
v2:增加了更多细节,手部与关键词响应表现更优,但受 Loras 影响较小,仍略偏爱“裸体白人女性”主题。
fp16(实为 v1):简约清新风格,细节不多,极易受 Loras 等因素影响。非常适合基础线稿插图,仍能处理部分“2.5D风格”。但手部表现仍不佳,容易生成裸体白人女性。
本模型融合了 3 到 8 个不同“卡通”风格模型,以不同权重比例组合,旨在呈现更丰富的“西方动画”风格,同时保持强大的提示响应能力与概念理解力。欢迎使用任何形式的提示词——包括 Danbooru 标签、不完整句子片段、诗歌等,尽情发挥。多种概念均可识别,风格可简可繁,随你所愿。因为这就是我喜欢的创作方式。还有女性角色……我确实喜欢女性角色。
本模型未包含 VAE。推荐使用标准的 Stable Diffusion VAE,如 Clear VAE,或我自制的 Anime VAE。
该模型可出色生成轻度成人内容(soft-core NSFW),但在处理重度成人主题时可能表现不足。可视情况使用 LoRAs 进行辅助。
所有图像均仅通过提示词生成,使用了一款名为 Umi AI 的高级通配符扩展工具,未使用任何其他扩展或后期处理技术。
若你对“外貌年龄”相关问题存在顾虑,强烈推荐以下模型:
Squeezer - Experimental
(一个 LoRA 模型,通过正向强度实现“减龄”,负向强度实现“增龄”,对细节和体态影响更大,而非整体构图)
Age Slider
(一组文本反转模型,可上下调节外貌年龄共 3 个层级,包含负向嵌入以增强效果。即使使用推荐强度值,也可能对生成图像的构图产生混乱影响。)
本次模型融合所用的以下模型:
(18.75%) UmiAI 的 Cartoon_Final_v2(未公开)
详见 Mythology and Babes by DutchAlex 及 Macross v2(18.75%) Toonify v2
(12.5%) 桥洞底下盖小被,逢人就说对对对
(12.5%) Kittenchow
(12.5%) Mistoon Amethyst
(12.5%) 捐出的私有模型,经明确授权使用
(6.25%) 23511-1546-幻色石
(6.25%) TypeB
请使用 Model Toolkit 扩展对您的模型进行处理(适用于 A1111)。该工具可修复 CLIP 损坏问题,并将模型裁剪为 fp-32 或 fp-16 格式。
免责声明:
如同 Stable Diffusion 原始版本发布以来的所有检查点一样,本模型对年龄相关关键词有响应能力,也具备生成非成人内容(NSFW)的能力。您如何使用本模型取决于您个人的选择。我建议在需要时使用负面提示来避免生成存疑图像。鉴于此,我将本模型标记为仅限成人受众。
也可在 Tensor.Art 上获取:https://tensor.art/models/612849265988992344
v2 说明:
这是对原模型的全面重构,添加了更多顶级模型。未使用任何额外的模型调节器(如 LoRAs),纯靠提示词驱动。我选择采用随机化提示结构制作网格预览,以展示该模型的真实能力。模型默认偏好浅肤色女性与裸露主题,对各类提示风格均有灵敏响应,无论是简短、长句、关键词列表、片段句式,还是混乱输入,均可驾驭。尤其在处理成人内容时,请务必明确指定您的需求。
- 使用 UmiAI 的通配符系统,您可在主提示词与负面提示中调用文本字符串。出现在成对星号 ** 之间的内容将被置入负面提示。下方展示的各提示词,以及对应每种风格类型使用的“质量标签”,即为示例网格的生成方式。
<[rngfem]>: "SFW, 1Girl, Adult, ({fat|slutty|cute|muscular} <[rng_intl]>:<[W3.*]>) woman, <[rng_smol]>, (<[rng_hair_multi]>:<[W3.*]>), wearing (<[rng_colors]>:<[W3.*]>) (<[fem_outfit]> outfit:<[W3.*]>), <[rng_gem]> jewelry, <[rng_metal]> accents, glowing {iris|pupils}, <[rng_colors_ext]> eyes, (<[rng_emote]> expression:<[W3.*]>), <[qt_face]>, <[rng_dgrw]>, <[qt_25D]>, <[18+]><[negs_logos]><[negs_body]><[negs_qual]>**naked, nude, **"
<[rngxfem]>: "NSFW, 1Girl, Adult, [naked|nude] ({fat|slutty|cute|muscular} <[rng_intl]>:1.2) woman, <[BEWBS]>, <[rng_hair]>, wearing see-through <[rng_colors]> <[fem_outfit]> outfit, <[rng_gem]> jewelry, <[rng_metal]> accents, glowing {iris|pupils}, <[rng_colors]> eyes, <[rng_emote]> expression, <[qt_face]>, <[qt_nsfw]>, <[rng_dg]>, <[18+]>"
flat: "flat colors, cel shading, hard shadows, outlines, vector art**realism, photorealistic, hyperrealism, professional photography, uhd, dslr, hdr, ultra high-definition, digital single-lens reflex, high dynamic range, 8k, 3D render**"
ani: "depth of field, bokeh, god rays, vivid colors, cinematic hard lighting, smooth shadows"
25d: "subsurface scattering, ray traced, depth of field, bokeh, god rays, vivid colors, cinematic hard lighting, realistic shadows, detailed textures**flat colors, cel shading, hard shadows, vector art, 2D, sketch, background without depth**"
photo: "cinematic lighting, depth of field, bokeh, realism, photorealistic, hyperrealism, professional photography, uhd, dslr, hdr**flat colors, cel shading, hard shadows, outlines, vector art, background without depth, 3D render**"
CFG Scale 20-30 设置通过以下扩展启用:Stable Diffusion Dynamic Thresholding (CFG Scale Fix)
本次模型融合所用的以下模型:
(25%) 来自 Macross V2 作者的未公开“Cartoon2-Final”
(25%) Kittenchow
(25%) 桥洞底下盖小被,逢人就说对对对
(25%) Toonify
vFP16 说明:
这是我第一次,也可能是最后一次尝试模型合并。
我完全不懂,只是看了些教程,按了几个按钮。
本模型融合了 3 到 4 个不同“卡通”风格模型,旨在创造出更具“西方风格”的混合效果,同时保持强大的提示响应能力。
真的,完全不需要提示指南,它能理解所有风格,包括动漫标签和“自然语言”式语句片段。
该模型与大多数 LoRAs 及负向嵌入兼容良好。
手部表现仍有改进空间,偶尔出现额外肢体的问题,但整体输出稳定可靠。




















