4th tail (anime/hentai)
详情
下载文件
关于此版本
模型描述
你最爱的尾巴~ 准备好体验完整的NAI3了吗?(实际上甚至更好)
基于180万张动漫图像数据集对Pony Diffusion 6进行全尺度微调:
原版Pony及其他模型缺失的(开源领域内)无与伦比的知识
8000+艺术家风格 (通配符),少量通用风格
仅通过提示即可生成数千个角色
没有其他地方常见的烦人水印
独特的视角、透视缩短、全身广角或极端特写毫无问题,背景美观作为额外加分项
从最可爱甜美的事物到最深邃黑暗的幻想
为你的狐狸/猫/狗/龙/... 娃娃/老公提供最佳的尾巴概念表现
好吧,这次微调的训练量足以构建一个基础动漫模型。尽管如此,原有的动漫知识不仅没有丢失,反而得到了显著增强。对TE训练的精准方法以及大量高质量自然文本标注(约60万条,主要由Claude3 Opus/Claude3.5 Sonet生成)极大提升了提示控制与理解能力。“感觉像一个新的基础模型,而不是Pony (c)”。
而且,与大多数仅是重新贴皮或脑切除式合并的PD衍生模型不同,本模型未合并任何LoRA。如有需要,你可以自由添加自己的调节器、合并其他喜爱的检查点,它完全兼容优秀的Pony基础模型。
v0.5.0 更新日志
使用新方法(预训练、主训练、精调)基于PD基础模型和大规模数据集重新训练
大量新增数据
经过一些“黑魔法”训练后,你现在可以生成完全黑色或完全白色的图像,且完全兼容现有工具、LoRA等。实际上这是一个非常有趣的实验范例
更好更稳定的基底风格,艺术家“烧图”现象减少
修复与改进……
(数据集截止日期为7月初,之后的请求已列入待办,未被遗忘)
功能与提示技巧:
首先,TE拥有海量知识。它会尽力实现你提示的一切,而不会像你以前习惯的那样忽略或回避。无引导护栏,无安全限制,无脑切除。 给它屎,它就吐屎。
那些需要你提升标签权重、额外添加标签才能获得些许响应的“分裂式提示”(如:(晴天,彩虹,空灵头发,透明皮肤,巨乳:1.9))将失效。你得到的可能是疯狂、诡异或出人意料的结果。
但如果你直接复制Booru图片的标签,不进行上述操作,或用自然语言结合标签描述——几乎在所有情况下都能获得极佳效果。为获得最佳结果,请坚持使用原始Booru标签。最深邃黑暗的幻想可能需要多次尝试,而流行主题非常稳定。
基础配置:
与所有SDXL一致,txt2img约100万像素,任何64的倍数分辨率(如1024x1024、1152x、1216x832等)。使用Euler_a采样器,CFG值4~9(6-7为最佳)。高分辨率修复:任意GAN/DAT,放大倍率1.5-1.6,降噪值0.5,单图块分辨率不超过300万像素时效果最佳。高分辨率修复和进一步放大能显著提升质量、细节、眼睛、手部、足部等。
如果生成时出现奇怪的色块或变形,请在你的生成工具设置中关闭 强调:无规范。
若使用LCM/PCM加速器,请使用Euler/Euler_a采样器,DDIM会产生大量混乱与怪异图像。
除非你使用的LoRA与之冲突,否则请保持Clip Skip为1。
质量分级:
仅使用4个质量标签:
正向提示:
masterpiece, best quality,
负向提示:
low quality, worst quality
请避免使用原版Pony中的 score_x、source_x 等标签。
在大多数情况下,这些标签只会让结果更糟:增加噪点、破坏身体结构、改变风格、并重新引入尿黄色滤镜。
它们确实只会让事情变得更糟,增加噪点、混乱,破坏身体和手指,改变风格,并重新带来尿黄色滤镜。
最初的质量标签实现显然不够理想,包含训练缺陷并消耗大量token。经过评估,我们决定引入新标签而非修复旧标签。目前,旧标签只会触发过时的干扰,而无实质改进。
负向提示:
(worst quality, low quality:1.1), error, bad hands, watermark, distorted
请根据你的偏好调整。
不要在负向提示中加入如灰度、单色、黄色背景等标签。你只会得到“烧毁”的图像,无需再修复褪色或“黄色滤镜”——这与你过去的做法不同。负向提示中加入“3d”在大多数情况下也是错误的。
如需改善背景,请在负向提示中加入:
simple background, blurry background, abstract background
但若你的提示内容本身要求“简单背景”,请记得移除这些标签。
艺术家风格:
使用方式:by 艺术家名称,可叠加多个,效果非常有趣,可通过提示权重控制:
by ARTISTNAME1, [by ARTISTNAME2, (by ARTISTNAME3:0.8),...]
或/和
[by ARTISTNAME1|by ARTISTNAME2|by ARTISTNAME3|...]
在提示最开头使用效果最佳。可作为通配符使用(注意:sd-dynamic-prompts插件在批次大于1时存在缺陷,可能导致结果异常)。对绝大多数情况,高分辨率修复/放大能大幅提升质量。
通用风格:
2.5d, bold line, smooth shading, flat colors, minimalistic, cgi, digital painting, ink style, oil style, pastel style
可组合使用(与艺术家风格一起),可设权重,同时适用于正负向提示。
角色:
使用与Booru一致的完整名称标签和正确格式,如 "karin_(blue_archive)" → "karin \(blue_archive\)",使用皮肤标签提升还原度,如 "karin \(bunny \(blue_archive\))"。此扩展非常有用。
大多数角色可通过名称识别,但若能同时提示其主要特征会更好,例如:
karin \(blue_archive\), karin \(bunny \(blue_archive\), dark-skinned female, purple halo, ponytail, yellow eyes, playboy bunny, fishnet pantyhose, gloves
自然语言:
与Booru标签结合使用效果极佳。请在写完风格和质量标签后,再使用自然语言。仅用Booru标签也可,完全由你决定。
是的,它仍基于Pony,因此在真实世界概念、参考或复杂表情方面,仍逊色于基于原版SDXL的其他检查点。请查看我的新模型 Tofu,它能更好处理这些内容。
大量尾巴/耳朵相关概念:
tail censor, holding own tail, hugging own tail, holding another's tail, tail grab, tail raised, tail down, ears down, hand on own ear, tail around own leg, tail around penis, tail through clothes, tail under clothes, lifted by tail, tail biting,...
(Booru含义,非e621)及其他大量自然语言描述。部分完美还原,部分需多次尝试。遗憾的是,在0.5.0版本中部分概念表现变差,但其他方面更好了。此外,现在对各种尾巴类型(不仅限于毛茸茸的兽娘)表现更佳。
亮度/对比度:
你可以直接用标签或自然语言提示你想要的效果,如“黑夜”、“黄昏”、“阳光明媚”等。黑色/白色背景可用,但有时不会生成纯黑(0,0,0)或纯白(255,255,255)。部分原因与提示相关——请检查哪些图片被标记为此类。使用短语如“(可爱的女孩站在完全黑色背景前)”可解决此问题。不过,常规使用中不会遇到问题,它表现得与NAI3一样好,甚至更好。
已知问题:
不幸的是,仍存在以下问题:
某些艺术家风格未能如预期工作。
(原因尚不明确,因为在其他使用相同数据集的模型中它们正常工作。可能与PD的1-token哈希冲突或原始TE的问题有关。未来有望修复,请报告你发现的无效艺术家风格。)
某些概念需要更多训练(少数尾巴相关、罕见如“dogeza”或梗图)
有时仍能发现水印。主要与Pony基础模型有关,部分来自训练数据集
Ciloranko 实际上是负鼠(LMAO)——数据集中一个挑选错误的样本
待发现,仍在开发中
欢迎提交未来模型的艺术家/角色建议。若发现某艺术家/角色/概念表现不佳、不准确或水印强烈,请报告,我会明确加入。敬请关注新版本。
许可证:
遵循Pony病毒式许可,参见原版。可自由用于你的合并、微调等,但请保留链接。
未来计划:
一个更大、更平衡、更精细分类的新数据集(2.5倍于当前)已准备就绪,但任何错误或缺陷都将付出巨大代价。当前版本的修复可能很快推出,但在下一次大规模训练前,我将收集更多反馈并测试新方法。如果你有建议、想分享经验、工具或训练方法,非常欢迎!
我考虑在数据集中加入一些兽人(furries)。这可能有益于解剖、姿势和概念,但因标签系统不同和审美范围广泛,实现难度不小。如果你有应对方法、推荐优秀/有趣的兽人艺术家,或能分享数据集——请私信。
使用自然语言标注(结合Booru标签)进行训练对SDXL而言前景广阔,新大型模型已内置此功能。当前本地VLM性能不佳,COG和Idefics3不错但过于SFW,joycaption易幻觉且提示控制困难,Llava太笨,其他模型也有类似问题。商用方案方面:Claude极其昂贵,Gemini审查严格,GPT-4o对此任务太蠢。
因此,未来你或许能看到一个基于本数据集SFW/NSFW动漫图像微调的多模态LLM,这将极大提升性能。哦,对了,这是预览版和展示。
Flux:前景光明,非常智能,但对GPU要求极高,甚至对“胸”都过度敏感。我已进行了一些训练,实现了“去审查”及少量动漫概念认知,但效果仍不理想。若你对此感兴趣,请告知。主要瓶颈在于训练工具(正在积极开发,希望很快能实现完整的T5训练)及约5-7倍的GPU时间需求,因此建议稍等片刻。
任何建议或请求,欢迎加入 Discord服务器
致谢:
匿名艺术家分享私人作品;Soviet Cat — GPU赞助;Sv1. — LLM访问、标注、代码;K. — 训练代码;Bakariso — 数据集、测试、建议、内参;NeuroSenko — 捐赠、测试、代码;T.、[] — 数据集、测试、建议;dga、Fi.、ello — 捐赠;以及其他帮助我的兄弟们。我爱你们 ❤️。
当然,也感谢所有提供反馈和建议的人,这非常宝贵。
捐赠
AI是我的爱好,我在其上花费金钱,而非乞求捐赠。若你希望支持——请分享我的模型、留下反馈、用兽娘画一张可爱图片。当然,也请支持原创艺术家。
不过,你的资金将加速后续训练与研究。
(请记住,我可能会把钱花在酒精或Cosplay女孩身上)
BTC: bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c
ETH/USDT(e): 0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db
如能提供GPU时间(A100+)——请私信。




















