Chroma
詳細
ファイルをダウンロード
モデル説明
皆様へ、
以前、私が開発中のオープンソースの基盤モデル「Chroma」について投稿しました。たくさんの貴重なフィードバックをいただき、心より感謝しています。今回は、基盤モデルのトレーニングがついに完了し、Chromaファミリー全体が皆様のご利用に準備できましたことをお知らせできることを大変嬉しく思います。
改めてこのプロジェクトの約束をおさらいしましょう:これらは真の基盤モデルです。
私は美学的なチューニングやDPOのようなトレーニング後処理は一切行っていません。これらは、素のまま、強力で、あなたが独自にファインチューニングするための完璧な中立的な出発点として設計されています。大変な作業は私たちが済ませましたので、あなたはその手間を省けます。
「大変な作業」とは、約105,000時間のH100GPU計算リソースを費やしたことを意味します。この膨大なGPU時間は、モデルに広範で多様なデータ分布を詰め込むことに使われました。このおかげで、これらのモデルを基にしたファインチューニングは格段に容易になります。
約束通り、すべてが完全にApache 2.0ライセンスで提供されています。アクセス制限は一切ありません。
TL;DR:
リリースブランチ:
Chroma1-Base: 512x512のコアモデルです。あらゆるクリエイティブプロジェクトの堅実で万能な基盤として最適です。長期的なファインチューニングを計画しており、エポックの最終段階で高解像度のトレーニングのみ行うことで収束を早めたい場合、このモデルをお勧めします。
Chroma1-HD: Chroma1-Baseを1024x1024解像度で高解像度ファインチューニングしたモデルです。高解像度向けの迅速なファインチューニングやLoRAを始めたい場合、これが最適な出発点です。
リサーチブランチ:
Chroma1-Flash: Chroma1-Baseを最適化して、このフロー・マッチングモデルをより高速化する方法を模索するために作成したバージョンです。これは、GANベースのトレーニングを用いずに高速モデルをトレーニングするための実験的な成果です。このデルタ重みを任意のChromaモデルに適用することで、処理速度を向上させることができます(ただし、強度を調整してください)。
Chroma1-Radiance [WIP]: Chroma1-Baseを大幅にチューニングしたバージョンで、モデルがピクセル空間モデルとして動作するように変更されています。これにより、VAEの圧縮アーティファクトの問題を理論上回避できます。
クアンタイズオプション
代替オプション: FP8スケーリングクアンタイズ(ComfyUIで使用される形式で、推論速度の向上が期待可能)
代替オプション: GGUFクアンタイズ版(ComfyUI-GGUFカスタムノードのインストールが必要です)
特別な感謝
このプロジェクトを可能にしてくれた支援者たちに心より感謝します。
プリトレーニングとデータ収集の費用を貴重なご支援で賄ってくださった匿名の寄付者様。あなたの支援は、オープンソースAIに大きな転換をもたらしました。
Fictional.ai さん。オープンソースAIの限界を押し広げるための素晴らしい支援に感謝します。
このプロジェクトを支援してください!
https://ko-fi.com/lodestonerock/
BTCアドレス: bc1qahn97gm03csxeqs7f4avdwecahdj4mcp9dytnj
ETHアドレス: 0x679C0C419E949d8f3515a255cE675A1c4D92A3d7
私のDiscord: discord.gg/SQVcWVbqKx


