Neta Cat Tower
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
はじめに
Neta Cat Tower は、NetaYume Lumina をファインチューニングしたテキストから画像を生成するモデルです。
このモデルは、アニメスタイルの向上を目的として訓練されました。
キャラクターの追加に関する学習は行っていません。
モデル構成要素
Diffusion Transformers (DiT): このモデル
テキストエンコーダー: 事前学習済み Gemma-2-2b
自動エンコーダー: 事前学習済み Flux.1 dev の AE
「all_in_one」は、DiT、テキストエンコーダー、自動エンコーダーを統合した単一モデルです。
Civitai にアップロードされたモデルは「all_in_one」DiT モデルです。
(ダウンロードファイルサイズを削減するため、アップロードされたモデルファイルを all-in-one から DiT に変更しました。)
すべてを統合したモデルをご希望の場合は、私の Hugging Face ページ からダウンロードしてください。
モデルの使い方
Neta Lumina のモデルカード をご参照ください。
Lumina Image 2.0 をサポートする WebUI を使用する必要があります。
ComfyUI
Forge Neo
推奨設定
サンプラー: res_multistep / euler_ancestral
スケジューラ: linear_quadratic
ステップ数: >=30
CFG(ガイドアンス): 4 – 5.5
解像度: 1024 × 1024、768 × 1532、968 × 1322、または >= 1024
プロンプト
Neta Lumina プロンプトブック をご参照ください。
キャラクターに関する知識については、NetaYume Lumina の Civitai ページ をご参照ください。
学習情報
私の Hugging Face ページ をご参照ください。
謝辞
- duongve: duongve さんの優れたモデルの共有に感謝します。














