AlbedoBase XL

详情

下载文件

模型描述


如果您觉得此模型有价值,请考虑支持我们。您的贡献将全部用于推动SDXL社区的发展。

🙋🏼‍♂️ 加入我们(Discord) |ㅤ 🛒 购买ㅤ |ㅤ 🌱 捐赠


AlbedoBase XL(SFW&NSFW)

无需使用精炼器,VAE已包含在内。


目标

Stable Diffusion XL 拥有35亿参数(不包括精炼器),约为SD v1.5版本的3.6倍。我相信这不仅仅是一个数字,而是一个能够带来显著性能提升的数字。

自从我们意识到,由于社区爆炸性的贡献,SD v1.5的整体性能已远远超越想象以来,已经过去了一段时间。因此,我正在致力于完成这个AlbedoBase XL模型,以期在XL版本中同样最优地重现v1.5所取得的性能提升。

我的目标是直接测试所有在Civitai上公开上传的Checkpoints和LoRAs的性能,并通过多个筛选器后,仅合并被判定为最优的资源。这将超越Midjourney等公司图像生成AI的性能。

截至目前,AlbedoBase XL v3.1 Large 已合并了约200个精选Checkpoints和251个LoRAs


更新日志

v3.1-Large

• 使用V3中采用的递归脚本,合并了超过50个精选的最新SDXL模型。

规格网格(370.7 MB):下载


v3-mini

我真诚地为让您久等表示歉意。

我一直在处理一些个人事务,同时在开发新版本时,也遇到了健康问题。即使在撰写这段文字时,我仍在这场挑战中挣扎。

我觉得仅提供简短的更新是不够的,因此恳请您理解并阅读这份更详细的说明。

自2.0版本发布以来,我一直致力于独立学习深度学习。我没有正式学位,除了具备一定的编程天赋,我的背景仅限于艺术领域。因此,尽管投入了大量时间与精力,我仍缺乏实现重大突破所需的数学与科学基础。但这段自主学习与研究的经历,已成为我生命中无价的财富。

最近,我偶然发现了一个可能带来重大突破的想法。自2.0版本以来,我重新推导了数百种公式与方法,终于开发出一种相当引人入胜且成功的算法。模型合并过程基于SDXL1.0与SD1.5,以及其它精心挑选的模型。这些模型被分为五大类别:“动漫”、“写实”、“艺术”、“NSFW”与“基础”,并作为数据集输入合并算法。这一方法带来了令人振奋的结果。

然而,算法开发虽具挑战,但性能测试阶段却更加艰难。在此期间,我的身心状况严重恶化,以至于我意识到,单靠自己已无法继续这项工作。这最终促使我决定发布此版本。

现在,我很高兴宣布备受期待的AlbedoBaseXL V3 Mini版本正式发布。尽管此模型是小规模合并,但它不局限于任何特定领域,在多个方面表现卓越,具备成为SDXL1.0新基础模型的潜力。(参考:我的合并算法并非“线性合并”,因此本质上可视为一个新的微调模型。)

该模型与现有的AlbedoBase模型一样,具有极强的通用性,在各方面均超越了以往所有版本。(NSFW内容虽然不极端,但较之v2.1等旧版本,表达范围更广。未来将发布专门的NSFW合并模型。)

另外,我注意到许多共享模型近期开始采用禁止合并或外部商业化的许可证,这令我深感失望,因为这阻碍了我使用一些真正优秀模型进行合并。

在此,我要衷心感谢那些提供免费许可证的模型开发者,让他们的高质量模型——这些凝聚了大量时间与心血的成果——得以被用于合并。

我很快会回来。

我热切期待您在“动漫”、“写实”、“艺术”、“2.5D”、“3D”和“NSFW”等多个领域进行性能测试。

作为模型开发者,我们只播下种子,最终培育它们、收获花朵与果实的,是您——模型的使用者与艺术家们。

一如既往,谢谢您。


若您希望通过小额经济支持来支持我的工作,请考虑使用以下链接。目前我无法获得稳定工作,生计前景不明。

🌱 捐赠

规格网格(380.5 MB):下载


v2.1
使用新合并算法与公式,重新合并并调整v0.1至v2.0。

规格网格(424.5 MB):下载

v2.0

感谢所有在AlbedoBase XL Pre上帮助过我的人。没有你们,这个版本的发布时间可能会晚得多。非常感谢!

  • 我编写了一个自定义脚本,将现有的AlbedoBase XL模型收敛为一个模型,根据我独特的公式,精确对齐所有U-Net与CLIP模块的行列权重。
  • 若您在图像生成时遇到问题(如无任何输出),请切换至CLIP SKIP 2或稍作修改提示词!某些提示词组合可能未被CLIP识别。此时,您可以调整词序、更换词汇,或最简单地更改CLIP SKIP。未来我将像v1.3一样逐步解决这些问题。

规格网格(403.5 MB):下载

v1.3

  • 为展示模型随机性所对应的品质,我将所有展示图的种子值标准化为“9”,并立即生成。
  • 特别是此版本,由于负面提示影响显著,保持负面提示框为空通常能获得优质效果

规格网格(438.7 MB):下载

  • 如您所见,随着步数增加,所有采样器均可使用,且质量也提升。
  • 由于我开发并合并的LoRA效果(如下所述),使用语句式提示词而非标签式(单词列表)提示词,与质量提升直接相关。
  • 合并了45个Checkpoints与7个LoRAs,随后依次合并了AlbedoBase v0.4与v0.3(小于0~5%),以重新激活那些已稀释过时的合并模型。
  • 在7个LoRAs中,有一个是我创建的:我使用GPT4-V对总计174张高质量图像进行分析与标注。合并此LoRA后,生成的图像清晰惊人,对提示词的理解也极为出色。

  • 自创的LoRAs仅在Ko-fi创意级及以上支持者处提供购买

v1.2

  • 合并了22个最新Checkpoints。

规格网格(565.6 MB):下载

v1.1

  • 更稳定。
  • 更细致。
  • 若您自认是高级用户,我推荐使用v1.0版本。若v1.0找到合适的设置,可输出更生动的作品。

规格网格(349.7 MB):下载

v1.0

  • 合并了106个LoRAs。
  • 合并了19个Checkpoints。
  1. 该模型会因您选择的设置而产生不同结果,因此在使用前务必查看规格网格
    • 我发现使用几个特定的负面提示,有助于解决眼睛不对称或图像像素化的问题。规格网格可能因您的CPU或GPU设备而异,故请将其作为一般参考。尝试几种负面提示以提升质量(如:斜视)。我发现在合并的LoRA数量增加时,难以在所有设置中均达到理想效果。但请在v1.0中关注这一优势:在正确设置下,它能产出各方面的惊人效果。未来我将带来更稳定的版本。
  2. 您可在展示图中或搜索他人分享找到有用的设置值。
  3. 一如既往,为获得最佳效果,请将负面提示留空
  4. 此v1.0版本耗费了大量心血,我将稍作休息。希望您能享受使用此模型,若您进行合并,请在Civitai上免费分享。这样,我们才能共同持续改进它。

规格网格(479.4 MB):下载

v0.4

  • 合并了132个LoRAs。
  • 合并了4个Checkpoints。

规格网格:下载

v0.3

  • 所有采样器均得到改进。
  • 实现了逼真的写实效果。
  • 更加稳定。

规格网格:下载

v0.2

  • 清晰度与细节显著提升。
  • 手脚表现更佳。
  • 美学大幅改进:构图、抽象、流动感、光影与色彩等。

v0.1

  • 在SDXL1.0模型基础上进行适当微调,精心有目的地合并Civitai上公开的40多个高质量模型
  • 测试主要聚焦于以最少的提示词标记获得最大质量,尚未验证使用大量标记时质量能提升多少。(请自行测试并分享结果)
  • 通常,现实与动画之间的中间点能获得最美的效果。
  • 尽管如此,只要使用恰当的提示词,几乎没有什么不能表达。(我断言,作为合并基础模型,它具有超越其他模型的丰富价值。但请注意,这目前仍是v0.1版本。)

此模型生成的图像

未找到图像。