Real Stable XL

詳細

ファイルをダウンロード

モデル説明

高解像度対応

552x616 から 1104x1232

新規追加:

https://github.com/lllyasviel/stable-diffusion-webui-forge

Stable Diffusion WebUI Forge

Stable Diffusion WebUI Forgeは、Stable Diffusion WebUIGradio をベース)の上位プラットフォームであり、開発を容易にし、リソース管理を最適化し、推論速度を向上させることを目的としています。

「Forge」という名前は「Minecraft Forge」にヒントを得ています。このプロジェクトは、SD WebUIのForgeとなることを目指しています。

オリジナルのWebUI(SDXL推論時、1024px)と比較すると、以下の速度向上が期待できます:

  1. 8GB VRAMのような一般的なGPUを使用する場合、推論速度(it/s)で約30〜45%の高速化が見込めます。GPUメモリ使用量のピーク(タスクマネージャー上)は約700MB〜1.3GB低下し、OOM(メモリ不足)しない最大扩散解像度は約2〜3倍に増加し、OOMしない最大バッチサイズは約4〜6倍に増加します。

  2. 6GB VRAMのような性能が低いGPUを使用する場合、推論速度(it/s)で約60〜75%の高速化が見込めます。GPUメモリ使用量のピークは約800MB〜1.5GB低下し、OOMしない最大扩散解像度は約3倍に増加し、OOMしない最大バッチサイズは約4倍に増加します。

  3. 24GB VRAMを搭載した高性能GPU(例:4090)を使用する場合、推論速度(it/s)で約3〜6%の高速化が見込めます。GPUメモリ使用量のピークは約1GB〜1.4GB低下し、OOMしない最大扩散解像度は約1.6倍に増加し、OOMしない最大バッチサイズは約2倍に増加します。

  4. SDXLでControlNetを使用する場合、OOMしない最大ControlNet数は約2倍に増加し、SDXL+ControlNetの処理速度は約30〜45%高速化します。

Forgeがもたらすもう一つの非常に重要な変更はUnet Patcherです。Unet Patcherを使用することで、Self-Attention Guidance、Kohya High Res Fix、FreeU、StyleAlign、Hypertileなどの手法を約100行のコードで実装できます。

Unet Patcherのおかげで、ForgeではSVD、Z123、マスク付きIp-adapter、マスク付きControlNet、PhotoMakerなど、多くの新機能が可能になり、サポートされています。

もはやUNetのモニキーパッチや他の拡張との競合は必要ありません!

Forgeは、DDPM、DDPM Karras、DPM++ 2M Turbo、DPM++ 2M SDE Turbo、LCM Karras、Euler A Turboなど、いくつかの新しいサンプリングアルゴリズムも追加しています(LCMはオリジナルWebUIの1.7.0以降で既に搭載されています)。

最後に、Forgeは私たちの役割だけを果たすことを約束します。Forgeはユーザーインターフェースに不要な意見に基づく変更を一切加えません。あなたは依然として100% Automatic1111 WebUIを使用しています。

モデルに使用した設定

ターゲットモデルを読み込む際:

SDXLClipModel

サンプリングステップ:40–50

CFGスケール:7–20

サンプリング方法:DPM++ 3M SDE Exponential + DPM++ 2M SDE Turbo

アスペクト比:1024x1024

このモデルで生成された画像

画像が見つかりません。