Iris XL

详情

下载文件

模型描述

IRIS XL

IRIS XL 是经过数月实验与精细调优的成果,旨在打造一个在人体解剖、姿势和风格化渲染方面表现卓越的模型——这正是我一直以来追求完善的领域。该模型结合了真实图像与合成图像的独特组合,并采用新颖的训练方法,突破了艺术推理的边界。

制作过程:

  • 21万张艺术家图像:我首先使用约210,000张来自booru源的图像(多数为NSFW)训练模型,帮助其掌握人体解剖结构,并扩展其艺术家/角色风格库,超越单纯的“小马风格”艺术。为了提升标签质量,超越常规booru所含标签的水平,我在大量数据集中添加了自然语言描述。这显著增强了模型解读与生成更细腻内容的能力。

  • 5万张小马 vs 5万张NovelAI:在基础训练后,我使用50,000张小马图像50,000张NovelAI图像对IRIS XL进行微调,两组图像均使用完全相同的提示词。目标是通过展示“不该怎么做”(小马风格)与“应该怎么做”(NovelAI风格),教会模型如何正确推理与创作艺术。

  • 维度微调:我提取了两种微调结果(均为dim512),并将其应用到模型中,但采用一种特殊方式:NovelAI微调赋予权重1,小马微调赋予权重**-1**。这一设计至关重要,用以明确告诉模型:小马风格的推理并非我们的目标。结果?模型在解剖与姿势表现上极为出色,远超传统小马模型的局限。

为何更优秀:

  • 解剖与姿势的提升:该技术大幅提升模型对人类解剖结构和自然角色姿态的理解能力,这是之前版本长期困扰的问题(如果你喜欢我的Bunny模型,你一定会爱上这个)。

  • 标签特定的学习率调整:训练期间,我提高了稀有标签的学习率,以帮助模型稳定并保留对罕见艺术家或角色的理解,确保模型不会遗忘低频标签,从而实现更稳健的总体性能。

创作历程:

过去两个月里,我利用我的4090显卡,断断续续地研发IRIS XL,不断测试、优化与学习。这是一项繁重的工作,但我对最终成果深感自豪。💪

早期访问:

由于这是规模庞大的项目,且经历了大量测试,我将开放为期两周的早期访问权限。如果你没有“buzz”但非常想试用,请私信我,我很乐意让你先行体验。😊

未来计划?

目前这主要是一次试验,我非常希望用10倍规模的数据集重现这一成果——但遗憾的是,我并没有现成的H100集群,因此我将缓慢而稳定地推进扩展。

此模型生成的图像

未找到图像。