Tofu [ANIME BASE MODEL]
详情
下载文件
关于此版本
模型描述
基于 SDXL-base 训练的动漫基础模型,使用包含 180 万张动漫图片的数据集。可爱、聪明、灵活,属于你!
是的,这是一个全新的 SDXL 动漫基础模型
在解剖结构上优于其他所有非马系动漫模型
在通用知识和安全内容(SFW)方面优于 Pony 和 NAI3
8000+ 艺术家风格(通配符),开箱即用的通用风格极少
全色域、全亮度范围,出色的底层美学
继承原始 SDXL 的知识,无“脑叶切除”
你可能一直缺失的独特体验
由于我拥有一定的 GPU 时间和优质数据集,我开始思考:是否有可能训练出一个具备广泛知识、尤其在 SFW/NSFW 动漫概念上表现卓越,同时避免像之前的 Pony 模型那样对 SDXL 进行“脑叶切除”的动漫模型?这个检查点正是答案和概念验证。它目前仍处于高度实验性阶段,许多地方尚需完善,但已具备可用性,在诸多方面表现优异,并拥有开源检查点所缺乏的功能。
Tofu 使用了与第 4 尾几乎相同的训练数据集,因此能够生成流行角色、模仿艺术家风格,并识别绝大多数 Booru 标签和概念。所有这些特性都结合了自然文本混合标注和独特训练技术。
手指等小细节表现良好。背景包含热门现实世界地点(来自 SDXL-base)或唯美的风景/城市景观。
姿态与 NSFW 表现尚可,不要期望它能像 Pony 那样完美——但与原版 Pony 相比,它并不差太多;尽管最好的 PD 调优/混合模型仍更胜一筹。但 Tofu 仍远超其他模型,足以满足大多数需求。如果你需要更“刺激”的效果——请使用 第 4 尾,过渡几乎无缝。
风格表现良好,优于 Pony 基础模型,且与 TE 无冲突或断裂问题。
是的,它可以生成文字,但表现非常弱,与 SD3/FLUX 相比犹如 SDXL-base 一样。至少它能做点什么。
与大多数 SDXL LoRA 兼容,部分 Animagine/其他检查点 LoRA 也可使用,但兼容性因模型而异。Pony 的 LoRA 无法直接使用,部分风格或概念 LoRA 可能有效,但效果不一。最重要的是:SDXL 的 ControlNet 完全兼容。Anytest(后缀为 AM,非 PD)也能给出不错的结果。
特性与提示词:
基础设置:
与所有 SDXL 相同,txt2img 约 100 万像素,任何分辨率为 64 的倍数的长宽比(1024x1024、1152x、1216x832……)。推荐采样器:Euler_a,CFG 值 49(67 最佳)。高分辨率修复:任选 GAN/DAT,放大倍数 1.5–1.6,去噪强度 0.5,单图块分辨率不超过 300 万像素时效果最佳。高分辨率修复和后续放大将显著提升质量、细节、眼睛、手、脚等。
如果生成时出现奇怪的色块或畸变,请在生成工具设置中启用 Emphasis: No norm。
若使用 LCM/PCM 加速器,请使用 Euler/Euler_a 采样器;DDIM 会产生大量混乱和怪异结果。
无需 Clip Skip,忘掉这个梗吧。
建议使用外部 SDXL VAE,如 fp16-fix;模型内嵌的 VAE 可能已过时。
质量评级:
masterpiece, best quality
用于正面提示
low quality, worst quality
用于负面提示。仅此而已。
不要使用诸如 score_x、source_x 等无意义标签,不要放进提示词,否则你只会得到图片上印着这些文字的废图。
负面提示词:
(worst quality, low quality:1.1), error, bad hands, watermark, distorted
根据你的偏好调整,但尽量保持简洁。
请勿在负面提示中添加如 greyscale、monochrome、yellow background 等标签,这不是 Pony 模型,否则你只会得到过度饱和、烧掉的图像。
如需改善背景,请在负面提示中加入:
simple background, blurry background, abstract background
但若你提示的内容本身需要简单背景,请记得移除这些标签。
艺术家风格:
带示例的网格图
使用方式:"by ARTISTNAME",多个艺术家风格组合可产生非常有趣的效果,可通过提示词权重控制。
by ARTISTNAME1, [by ARTISTNAME2, (by ARTISTNAME3:0.8),...]
或/和
[by ARTISTNAME1|by ARTISTNAME2|by ARTISTNAME3|...]
在提示词最开头使用效果最佳,也可作为通配符。对大多数情况,高分辨率修复/放大能显著提升质量与识别度。
通用风格:
2.5d, bold line, smooth shading, flat colors, minimalistic, cgi, digital painting, ink style, oil style, pastel style
可组合使用(也可与艺术家风格结合),支持权重,可置于正负提示中。未来将增加更多风格。
自然语言文本:
与 Booru 标签结合使用效果极佳。仅在输入风格与质量标签后使用自然语言文本。也可仅用 Booru 标签,完全由你决定。
与 Pony 不同,本模型对现实概念(如汽车、机械、其他参考物)支持良好。但请勿期望其接近 FLUX,其规模与架构不可同日而语。
尾巴/耳朵相关概念:
有一定效果,但尚未达到理想水平。
tail censor, holding own tail, hugging own tail, holding another's tail, tail grab, tail raised, tail down, ears down, hand on own ear, tail around own leg, tail around penis, tail through clothes, tail under clothes, lifted by tail, tail biting, ...
亮度/对比度:
你可以直接使用标签或自然语言描述你想要的效果,如 dark night、dusk、bright sun 等,通常都能奏效。黑白背景可用,但有时无法生成纯黑(0,0,0)或纯白(255,255,255)。多数情况与提示词相关——请参考 Booru 上对应标签的图片。
幸运的是,使用自然描述如 “(cute girl in front of completely black background)” 可有效解决此问题。但常规使用中你通常不会遇到问题,其表现与 NAI3 类似,甚至更好。
已知问题:
在复杂姿势与场景中表现不佳,仍需更多训练
可能存在偏见
Ciloranko 实际上是负鼠(LMAO)(数据集中某个精选样本的错误)
持续开发中,高度实验性,首创模型,等等
欢迎为未来模型推荐艺术家/角色。如发现某艺术家/角色/概念表现不佳、不准确或带有严重水印,请报告,我会明确加入训练。请关注新版本更新。
留下你的反馈,这非常宝贵且重要。
许可证:
嘿嘿~
由于没有马受到伤害,本模型许可与原始 SDXL 一致。允许衍生作品、商业用途等(请遵守原许可条款,勿违反你所在国家法律)。但请勿声称你拥有此基础模型的版权,它极易识别。
致谢:
感谢愿匿名分享私有作品的艺术家们;Soviet Cat —— GPU 赞助;Sv1. —— LLM 访问、标注、代码;K. —— 训练代码;Bakariso —— 数据集、测试、建议、内参;NeuroSenko —— 捐赠、测试、代码;dga、Fi.、ello —— 捐赠;以及其他所有帮助过我的朋友们。我爱你们 ❤️。
当然,也感谢所有提供反馈与请求的用户,你们的建议极其宝贵。
捐赠
AI 是我的爱好,我在为它花钱,而不是乞求捐赠。如果你希望支持我——请分享我的模型、留下反馈、用兽耳女孩画一张可爱的作品。当然,也请支持原始艺术家们。
你的资金能加速进一步的训练与研究。
(请记住,我可能会把它花在酒精或 Cosplay 女孩上)
BTC: bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c
ETH/USDT(e): 0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db
如果你能提供 GPU 时间(A100+)——请私信。




















