RealCartoon3D
详情
下载文件
关于此版本
模型描述
查看我的 Mage.Space 独家模型: RealCartoon - Mage
您也可以在 sinkin.ai 和 mage.space 上运行此模型:
想提供一些支持吗? (在 Ko-fi 捐赠)
向下滚动查看一些提示建议
如果您想为人物添加一些年龄感,我测试了 Age Slider,效果不错: Age Slider
也推荐在负面提示中使用 easynegative, badhandv4
历史背景:
RealCartoon3D 是我上传的第一个模型。那时我还在学习这一领域,但希望创建一个检查点,当输入我喜欢的风格时,能实现我想要的效果。当时设定的一些目标(随时间更新):
1. 人类形象的多样性(例如:非洲、欧洲、亚洲等)。我不希望它只生成我 everywhere 看到的那种单一风格。
2. 生成带有写实感的卡通风格
3. 与 LoRAs 兼容良好。(因为这才是真正实现自定义的地方)
我的目标是让这个检查点能够在第一次或第二次提示时就表现良好(我的电脑只是台游戏本,运行这类任务时会变得非常热 lol…… 已经有一次把电池耗尽了)。
在这个过程中我学到了很多,甚至开始创建其他检查点(RealCartoon-Anime、Realistic、Pixar 和 2.5D),以提供更专注的风格变体。这个检查点是所有这些的基础,偶尔也会合并到其他项目中。但这个版本始终是我的主模型……尽管那个 PIXAR 版本看起来确实很棒 :P
希望你们都喜欢它! 请留下评价并分享你的作品。我非常感谢大家的下载和支持反馈 (谢谢大家)。我从未想过会获得如此多的关注。
创作过程:
合并的起始检查点是 2023 年 5 月期间的几个顶尖模型(这些检查点当时/现在都没有对合并设置限制)。我也内嵌了 VAE (vae-ft-mse-840000-ema-pruned)。我尝试过 ClearVAE(它能产生不错的效果,但有时会出错——可能是因为我的电脑问题)。我不想让下载此模型的任何人遇到这个问题,因此没有使用这个 VAE。遗憾的是,我没有资源从零开始训练;但我发现很多人都是基于这些顶尖检查点进行训练的。随着时间推移,我会寻找那些具有独特风格、精彩背景(或有时是奇怪效果)的检查点,以提升整体效果 (同时避免那些有合并限制的模型,以免干扰他人成果或陷入授权纠纷)。一个始终存在的问题是手部变形——它们总是无法正确生成(许多 SD 1.5 的检查点都有这个问题);但随着持续合并,手部逐渐变好。接着,我会寻找能影响风格的 LoRAs。这些 LoRAs 不是为了取代检查点,而是帮助塑造风格——因为我想让用户保持对风格的控制权,而这正是 LoRAs 的意义所在。
总体而言,这个检查点随着不断改进而迅速迭代。最终在 3.0、3.1 版本时开始真正达到我想要的效果,随后当然就是第 4 版本(更新速度也略微放缓)。我仍然喜欢旧版本;这些旧版本正是其他 RealCartoon 检查点的灵感来源,因为正是在这些迭代中,主模型的风格才逐渐成型。
提示设置:
(以下设置适用于 A1111 ):
下图是我推荐的顶部设置。我通常不使用 VAE,因为
(vae-ft-mse-840000-ema-pruned) 已内嵌。

以下是我在生成大多数图像时常用的默认设置。

当然,根据所需效果(例如风景图)会有不同调整。我也喜欢生成 竖版 512x904 的图像。我只在检查检查点或寻找完美图像时才运行批量生成,通常设为 1
我主要使用的采样方法是 Euler a,但 DPM++ SDE Karra 和 DPM++ 2M Karras 效果也很好。
Euler 采样器的新版本(licyk 的 Advanced Euler) - https://github.com/licyk/advanced_euler_sampler_extension
这个版本在手部表现上更好
通常生成图像速度更快
放大器我通常使用 R-ESRGAN 4x+ 或 4k-UltraSharp
放大设置会根据您的电脑而有所不同。
如果主体在远处,我会运行 ADetailer,因为 SD1.5 有时在处理远距离人物面部时会出错。注意:如果您背景中有模糊主体,ADetailer 可能会“增强”它们,从而破坏整体效果。
如果您在运行 A1111 时遇到问题,可以通过右键打开“webui-user.bat”文件进行修改:
- set COMMANDLINE_ARGS= --xformers
如果您没有 xformers 或无法安装,请使用以下设置:
- set COMMANDLINE_ARGS= --disable-model-loading-ram-optimization --opt-sdp-no-mem-attention
安装 xformers: 如何安装 xformers
提示建议:
关于提示,这完全取决于您。以下是一些建议:
请谨慎设定 LoRAs 的强度,因为这会显著影响与检查点的整体融合效果。强度越高并不一定越好。我通常根据 LoRa 的不同,设置强度为 0.4 到 1。
提示中排在最前面的内容优先级最高。
使用括号会增加优先级,但把所有内容都放在括号里,效果几乎与不加括号一样。
提示中的细微变化(包括标点符号)都可能改变生成图像。
种子有助于在相同软件和设置下生成相似图像,但不能保证完全一致,因为即使是软件(如 ComfyUI)或硬件的差异也会影响结果。
如果您希望获得更卡通的效果(至少针对此检查点),请在提示开头附近使用以下关键词:Anime、Cartoon、painted 或 comic。这不保证一定实现某种风格(取决于版本),但会更倾向于该方向。这对写实风格同样适用(如 Realistic、real 等)。
如果您希望避免出现裸露内容,请在负面提示中加入以下关键词:nude、nudity、naked、NSFW、nipples。当然,如果这些词出现在正向提示中,则很可能会生成相关内容。
我通常在负面提示中使用以下内容(您可以点击 easynegative 或 badhandv4 获取文件):
easynegative,(badhandv4),(bad quality:1.3),(worst quality:1.3),watermark,(blurry),5-funny-looking-fingers
注意:Badhandv4 是一个嵌入模型,需放入 A1111 的 embedding 文件夹中。
为何有如此多版本?
因为我希望分享所有我认为达到理想效果的成果,这让我乐在其中,也看到很多人喜欢这些版本——这激励了我继续改进。再次感谢大家!
许可与使用
本模型为开放访问,采用 CreativeML OpenRAIL-M 许可证,进一步明确使用权利。
1. 不得使用本模型故意生成或传播非法或有害的内容。
2. 作者对您生成的输出不主张任何权利,您可以自由使用,但需自行对其使用负责,且不得违反许可证规定的条款。
3. 您可以重新分发权重。如您这样做,请注意您必须包含与许可证相同的使用限制,并向所有用户共享修改后的 CreativeML OpenRAIL-M 许可证副本(请完整仔细阅读许可证)。
请在此处阅读完整许可证:Stable Diffusion
使用限制:
您同意不得以任何方式使用本模型或其衍生模型:
- 违反任何适用的国家、联邦、州、地方或国际法律或法规
- 用于剥削、伤害或试图剥削、伤害未成年人
- 生成或传播可验证的虚假信息和/或内容以伤害他人
- 生成或传播可用于伤害个人的可识别个人信息
- 诽谤、贬低或骚扰他人
- 用于对个人法律权利产生不利影响或创建/修改具有约束力和可执行义务的全自动决策
- 用于任何旨在或会导致基于在线或离线社会行为或已知或预测的个人或性格特征歧视或伤害个人或群体的用途
- 利用特定人群的年龄、社会、身体或心理特征的脆弱性,以实质性扭曲该群体成员的行为,导致或可能造成该人或其他人身体或心理伤害
- 用于任何旨在或会导致基于法律保护特征或类别歧视个人或群体的用途
- 提供医疗建议和医疗结果解读
- 生成或传播用于司法管理、执法、移民或庇护程序的信息,例如预测个人将实施欺诈/犯罪行为(例如通过文本画像、在文件陈述之间建立因果关系、无差别或任意目标使用)。
使用条款:
- 您应对因不道德使用本模型而产生的任何法律责任负全责
- 如果您将这些模型用于合并,请说明您所采取的步骤,并明确指出所做的修改
备注:
如果您发现任何冲突或需要修正的地方,请告知我。




















