Chroma

详情

下载文件

模型描述

大家好,

不久前,我分享了我正在开发的开源基础模型 Chroma,收到了大量宝贵的反馈。现在,我非常兴奋地宣布:基础模型的训练终于完成了,整个模型家族现已全面上线,欢迎使用!

简单回顾一下我们的承诺:这些是真正的基础模型

我没有进行任何美学调优,也没有使用 DPO 等后训练技术。它们是原始、强大且专为成为你微调的完美中性起点而设计的。我们已经完成了繁重的工作,让你无需再从头开始。

所谓“繁重的工作”,指的是约 105,000 个 H100 小时的算力投入。所有这些 GPU 时间都用于为模型注入海量的数据分布,这将使基于它们的微调变得轻而易举。

如承诺的那样,所有内容均完全采用 Apache 2.0 许可证——无任何限制。

简要总结:

发布分支:

  • Chroma1-Base 这是核心的 512x512 模型,是几乎所有创意项目的坚实通用基础。如果你计划长期微调,然后仅在训练周期末尾对高分辨率进行训练以加速收敛,建议使用此模型。

  • Chroma1-HD 这是 Chroma1-Base 在 1024x1024 分辨率下的高分辨率微调版本。如果你希望快速进行高分辨率微调或 LoRA,这就是你的起点。

研究分支:

  • Chroma1-Flash 这是我为探索如何加速流匹配模型而对 Chroma1-Base 进行的微调版本。从技术上讲,这是实验性成果,旨在不使用任何 GAN 训练的情况下训练出更快的模型。其增量权重可应用于任何 Chroma 版本以加速推理(请确保调整强度)。

  • Chroma1-Radiance [开发中] 这是对 Chroma1-Base 的激进重构版本,模型现在直接在像素空间中运作,理论上应能避免 VAE 压缩带来的伪影。

量化选项

特别鸣谢

衷心感谢让本项目成为可能的支持者们。

  • 一位匿名捐赠者,其非凡的慷慨资助了预训练和数据收集工作。你的支持对开源 AI 具有变革性意义。

  • Fictional.ai 的出色支持,帮助推动了开源 AI 的边界。

支持本项目!

https://ko-fi.com/lodestonerock/

BTC 地址:bc1qahn97gm03csxeqs7f4avdwecahdj4mcp9dytnj
ETH 地址:0x679C0C419E949d8f3515a255cE675A1c4D92A3d7

我的 Discord:discord.gg/SQVcWVbqKx

此模型生成的图像

未找到图像。