Clarity XL

詳細

ファイルをダウンロード

モデル説明

説明を読む

注: Clarity XL は現在 ベータ版 です。

ファインチューニングは進行中です。

写実主義が好きですか? 私の最新のSDXLファインチューンをご覧ください:NatViS


変更履歴

8/26/24 ClarityXL v2.0 Lightning 8step

  • 要望により、ClarityXL v2.0の8ステップライトニング版をリリースしました。詳細は「このバージョンについて」をお読みください。

    • 注: 色が薄く見える場合は、CFGを低め(1.5 - 2.5)に設定してください。サンプル画像では誤って設定値を高めにしてしまいました。

————

8/12/24 ClarityXL v2.0

  • ClarityXLのv2.0をリリースしました。新しい機能については「このバージョンについて」をご覧ください。

コーヒーを一杯おごってください ❤

https://ko-fi.com/ndimensional

私は電子的な寄付依頼はあまり好きではありませんが、この規模のSDXLファインチューンはコストが高くなってきています。そのため、私が作成したモデルを気に入っていただき、支援したいという方がいらっしゃれば、Ko-Fi で寄付を検討していただけますと幸いです💗
今後、更新情報を投稿したり、質問に回答したり、フィードバックを受けて、支援者向けに早期アクセスモデル(非独占)をリリースする予定です。

すべての寄付は、新しいStable DiffusionファインチューンおよびオープンソースAIツールの開発資金に充てられます。


概要

SD1.5用のオリジナルClarityモデルに続く形で、Clarity XLは、より複雑なSDXLアーキテクチャ内において、オリジナルモデルの機能を再現・拡張しようとする試みです。

Clarity SD1.5 と Clarity XL の違い

現在、Clarity XL は写実主義にのみ焦点を当てています。これは、今後のリリースで拡張するための基盤を構築する意図的な選択です。Clarity XL が「汎用モデル」になることは決してありません。常に写実主義に偏ったモデルであり続けます。今後のリリースでは、より複雑な写実的・映画的シーンの機能を追加する予定です。

改善点

  • 本物の(手を入れられていない)写実主義を重視。

  • 高い画像忠実度。

  • プロンプトの忠実性: モデルがプロンプトをどれだけ正確に実行するか。

    • モデルが学習していない概念は除きます
  • 肌の質感の改善。

  • 全体的な美しさの向上。

  • ビデオゲーム/映画のキャラクター認識。

    • 世界観、風景、設定なども含みます。
  • 自由なプロンプト記述: 自然言語、カンマ区切りリスト、両者のハイブリッド形式をすべて受け付けます。プロンプトの長さは、短くても長くても構いません。

制限事項

  • 複雑なシーン: 例:手から光の稲妻を発射し、鮮やかな青いきらめく弧の群れが爆発する。

  • 複数メディア生成: 現在のモデルは写実主義と映画的表現に特化しています。

モデル詳細

  • ベースモデル: Stable Diffusion XL v1.0

    • Clarity XL v1は中間学習エポックであるため、このエポックを未リリースのLomoXLファインチューンとマージしました。ベースエポックの重み行列を保持するために、DAREマージ手法を修正したバージョンを使用しました。この処理は今後のリリースでは不要になります。
  • データ: データセット作成では品質を最優先しました。すべての画像-キャプション対を複数回クリーニングし、高品質なデータのみを使用してファインチューニングを行いました。

    • キャプション: キャプションは私のMLLMキャプションシステムによって生成され、GroundingDINO + 推論エンジン + NLPによって検証されました。

      • キャプションは自然言語形式で記述されていますが、SDXLのテキストエンコーダーは複数のプロンプトスタイルを可能にします。
  • VAE: sdxl-vae-fp16-fix

  • アスペクト比: トレーニングデータに基づき、SDXLの一般的なアスペクト比はすべて対応しています。

    • 1344x768 (16:9) — 映画的な映像カット

    • 1536x640 (21:9) — 超ワイド映画的な映像カット

    • 1152x896 (4:3) — フルスクリーン

    • 1216x832 (3:2) — モバイル風景

    • 1024x1024 (1:1) — 正方形

    • 1024x704 (11:16)

    • 768x1344 (9:16) — 縦長(Instagramストーリーズ / Snapchat)

    • 896x1152 (3:4)

    • 832x1216 (2:3) — モバイルポートレート

    • 704x1024 (16:11)

🤗Huggingfaceリポジトリ


変更履歴

5/23/24 Clarity XL v1.0:

  • 初回リリース

その他のモデルをご覧ください

SDXLチェックポイント: https://civitai.com/collections/966964

SDXL LoRAs: https://civitai.com/collections/966969

40Kシリーズ: https://civitai.com/collections/956187

SD1.5チェックポイント: https://civitai.com/collections/966974

SD1.5 LoRAs: https://civitai.com/collections/966972


Tensor ArtでClarity XLを実行: https://tensor.art/models/740350571376126636?source_id=nj2-r1nnnUO3ovUiaHf19Bgn

このモデルで生成された画像

画像が見つかりません。