RobMix CosXL Edit

roblaughter

157

3.3K

photorealistic style photography リアル cosxl

CosXL Zenith v2.0 CosXL Edit 1.0

詳細

ファイルをダウンロード

このバージョンについて

これは CosXL Edit チェックポイントです。 ダウンロードする前にお読みください。

ComfyUI の例ワークフローをダウンロード こちら。

Stability CosXL HuggingFace より

"Cos Stable Diffusion XL 1.0 Base は、コサイン連続 EDM VPred スケジュールを使用するよう調整されています。このスケジュール変更の最も顕著な特徴は、真っ黒から純白までのフルカラーレンジ を生成する能力であり、各ステップでの画像の変化率にもより微細な改善が施されています。"

"Edit Stable Diffusion XL 1.0 Base は、コサイン連続 EDM VPred スケジュールを使用するよう調整され、さらに指示に基づく画像編集を実行するように強化されています。このモデルは、ソース画像とプロンプトを入力として受け取り、プロンプトを画像をどのように変更するかという指示として解釈します。"

私の初期テストでは、CosXL Edit ベースモデルはすでに非常に優れていましたが、さらに少し「何か特別な」要素を与えるために、最近の SDXL チェックポイントのマージをいくつか組み合わせたくなりました。

メリットとデメリット

メリット：

比類のないコントラスト
超シャープ
SDXL よりも興味深い構図と多様性を有しているように見える

デメリット：

CFG に対して 非常に 感度が高い。4.0 を超えると、リスケールしてもアーチファクトが発生する可能性が高い
サブジェクトの知識が限られている

CosXL チェックポイントの使い方

本記事を投稿した時点では、ComfyUI と StableSwarmUI は CosXL を標準サポートしています。 他の Web UI でのサポートについては聞いていません。

コントラストやディテールをより細かく制御するには、モデルパイプラインに ModelSamplingContinuousEDM ノードを追加し、sigma_max と sigma_min の設定を調整してください。

正確な情報ではないかもしれませんが、これらは各ステップで画像から除去可能なノイズの最大・最小量を表していると理解しています。

sigma_max を上げると画像のコントラストが強化されますが、過剰にすると画像が焼けてしまう傾向があります。標準値は 120 のようですが、私はやや高い値を好みます。

sigma_min を極端に低い値に下げることも可能ですが、0.0001 よりも低い値や、0.1 よりも高い値では明らかにアーチファクトが発生します。

CosXL Edit のプロンプティング

プロンプティングは簡単です。変更したい内容をそのまま入力してください。たとえば、画像に山頂に座る男性が写っている場合、「金髪の女性」とプロンプトするだけで十分です。

推奨設定

例の ComfyUI ワークフローを こちら からダウンロードしてください。

これらのモデルは CFG に対して 非常に 感度が高いため、値を低めに保ってください。cfg_text と cfg_image の比率を調整して、それぞれが最終画像に与える影響のバランスを取ってください。CFG を高すぎると画像がすぐに焼けてしまいます。

最初の試行

40 ステップ
cfg_text: 2.5
cfg_image: 1.5
DPM++ 3M SDE Karras

追加で以下の設定を適用するとさらに効果的です：

FreeU
- B1: 1.05
- B2: 1.08
- S1: 0.95
- S2: 0.88
セルフアテンションガイド
- scale: 0.5–0.8
- blur_sigma: 2.0–4.0
CFG リスケール: 約 0.3

モデル説明

RobMix CosXL Edit がアップグレードされました。

私は RobMix Zenith で得られる結果に非常に満足しており、これが CosXL Edit とどのように組み合わさるか試してみたくなりました。このバージョンも非常に優れた結果を出しており、あなたにも役立つ可能性があるため、公開することにしました。

以前のバージョンは簡単な素早く粗いマージでした。今回のバージョンでは、画像モデルの品質とプロンプトの適合度を最大化し、Edit モデルの指示従順性を最適化するため、ブロックごとに重みを調整し、ミックスをより丁寧にチューニングしました。

内部的には、このバージョンには Zenith に含まれるすべての優れた要素が追加されています。

私のスタイルプロンプトライブラリで試してみてください。

サンプル画像の多くは、正のプロンプトとして私のスタイルプロンプトとキャラクタープロンプトをそのまま使用し、Text CFG を 3～4、Image CFG を 1 に設定して作成しました。

プロンプトは RobMix Zenith 用に最適化されています。

**これは CosXL Edit チェックポイントです。ダウンロード前にお読みください。**

Download ComfyUI の例ワークフロー こちら.

Stability CosXL HuggingFace より：

"Cos Stable Diffusion XL 1.0 Base は、コサイン連続 EDM VPred スケジュールを使用するよう調整されています。このスケジュール変更の最も顕著な特徴は、真っ黒から純白までの完全な色範囲を生成できることであり、さらに各ステップでの画像の変化率にも微細な改善が施されています。"

"Edit Stable Diffusion XL 1.0 Base は、コサイン連続 EDM VPred スケジュールを使用するよう調整され、さらに指示に基づく画像編集を実行できるようにアップグレードされています。このモデルは、入力画像とプロンプトを受け取り、そのプロンプトを画像をどのように変更するかという指示として解釈します。"

私の初期テストでは、CosXL Edit ベースモデルはすでに素晴らしかったですが、それに少し「何か特別な」要素を加えるため、最近の SDXL チェックポイントのマージ結果を統合しました。

利点と欠点

利点：

比類ないコントラスト
超シャープ
SDXL よりも興味深い構図と多様性を有しているように見える

欠点：

CFG に非常に敏感。4.0 を超えると、リスケールしてもアーティファクトが発生します。
サブジェクトに関する知識が限られている

CosXL チェックポイントの使い方

この投稿時点では、ComfyUI と StableSwarmUI は CosXL をそのままサポートしています。 他の Web UI でのサポートについては、私は聞いていません。

コントラストとディテールをより細かく制御するには、モデルパイプラインに ModelSamplingContinuousEDM ノードを追加し、sigma_max と sigma_min の設定を調整してください。

ただし、これは私の理解に基づくものであり、正確性を保証しませんが、これらは各ステップで画像から除去できるノイズの最大値と最小値を示していると理解しています。

sigma_max を上げると画像のコントラストが強化されますが、過剰に上げると画像が燃えてしまう傾向があります。標準は 120 のようですが、私はやや高めの値が好みです。

sigma_min を極端に低く下げることも可能ですが、0.0001 より低く、または 0.1 より高くすると、明らかなアーティファクトが発生します。

CosXL Edit のプロンプティング

推奨設定

ComfyUI の例ワークフローをこちらからダウンロードしてください。

これらのモデルは CFG に対して非常に敏感なので、値を低めに保ってください。cfg_text と cfg_image の比率を調整して、それぞれが最終画像に与える影響のバランスを取りましょう。CFG を高めすぎると、画像がすぐに燃えてしまう傾向があります。

第1回生成

40 ステップ
cfg_text: 2.5
cfg_image: 1.5
DPM++ 3M SDE Karras

さらに追加で、以下を設定すると効果的です：

FreeU
- B1: 1.05
- B2: 1.08
- S1: 0.95
- S2: 0.88
Self-Attention Guidance
- scale: 0.5–0.8
- blur_sigma: 2.0–4.0
CFG Rescale: 約 0.3

このモデルで生成された画像

並び替え

画像が見つかりません。

モデルタイプ	チェックポイント
ベースモデル	SDXL 1.0
公開日	4/13/2024