Sigma Proletarian
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
Sigma Proletarianは、約5万枚の画像で5エポック学習したPixart Sigmaの小さなファインチューン版です。依然として深刻な学習不足である可能性がありますが、ベースモデルとは明確に異なります。
このモデルを使用するには、お好みのT5テキストエンコーダーが必要です。SD3テキストエンコーダーに対応するように設定すれば動作し、ComfyUIで6GB VRAMのlowvramモードで実行可能です。小さな量子化版を使用すると品質が若干低下しますが、依然として使用可能です。
モデルは自然言語のプロンプトに良く対応しますが、danbooruスタイルのタグもそれなりに扱えます。品質を向上させるために、プロンプトの前に配置することで学習された少数の合成データで訓練されたいくつかの品質タグ(apg_v3、pda_v10、pdxl_v6、hw_5)があります。学習データには約50人のアーティスト名が含まれていますが、それらのスタイルをプロンプトで指定しても、そのスタイルを明確に表現することはできません。












