900M PixArt Sigma

詳細

モデル説明

PixArt Sigma 900M: 改良されたテキスト→画像モデル

モデル概要

PixArt Sigma 900Mは、PixArt Sigmaアーキテクチャに基づくテキストから画像を生成するモデルです。このバージョンは、元の600Mパラメータのベースモデルから900Mパラメータに拡張されています。以下の2つの異なったバリアントが利用可能です:

  1. PixArt Sigma 900M Base(写実的)

  2. PixArt Sigma 900M アニメ

主な特徴

  • 9億パラメータ(ベースモデルより3億増加)

  • 画像生成品質の向上

技術的詳細

  • アーキテクチャ:PixArt Sigmaバリアント

  • パラメータ数:9億

  • ベースモデル:600M PixArt Sigma

クレジット

ComfyUIとの互換性

現在、ComfyUIはこのバリアントをネイティブでサポートしていないため、カスタムノードが必要です。必要なカスタムノードは以下から取得できます:https://github.com/city96/ComfyUI_ExtraModels

必要なコンポーネント

  1. T5モデル

    • ダウンロード先:Hugging FaceのPixArt-alpha/PixArt-Sigma-XL-2-1024-MS at main (huggingface.co)

    • ファイル命名規則:リポジトリ内に表示されている通りにT5モデルファイルを命名してください

    • 重要:ファイル名に「text_encoder」が前置されている場合は、必ずそれを削除してください

セットアップ手順

  1. 上記のHugging FaceリポジトリからT5モデルをダウンロードする

  2. 必要に応じてT5モデルファイルの名前を変更し、「text_encoder」のプレフィックスを削除する

  3. GitHubリポジトリからカスタムComfyUIノードをインストールする

  4. ComfyUI_ExtraModelsのドキュメントに従って、すべてのモデルファイルを適切なディレクトリに配置する

このモデルで生成された画像

画像が見つかりません。