Initium | Finetune | NoobAI Epsilon 1.1
詳細
ファイルをダウンロード
モデル説明
Initium (SDXL、IllustriousXL): Initiumとは?
- Noobai V1.1を基盤とし、NoobAI 1.1の残存する問題のいくつかを「修正」することを目的としたモデルです。独自のマージを構築するためのモデルであり、このモデルに共通の出自を持つマージのトレーニングベースとして最適です。
特徴:
カスタムトレーニング済みテキストエンコーダ: 独自のCLIP/TENCトレーニングとそのへのU-netアラインメントを組み込んでいます。
データセット: ~~22万枚の画像データセット(lucereron + Initium v1 データセット + 新規データ)でトレーニング。データセットは「1人の女の子」に特化しておらず、異なる風景、抽象的表現、人物なしの画像も生成することを意図しています。女の子へのバイアスはやや低減されています。また、こちらのアーティストリストがトレーニング対象に含まれています。アーティスト名の使用にはエスケープ文字(例:sen \(astronomy\))が必要です。多くのアーティストのサンプルは以下でご確認いただけます:https://files.catbox.moe/9lglyd.png、https://files.catbox.moe/4earj9.png、https://files.catbox.moe/b5egkz.png、https://files.catbox.moe/timjci.png、https://files.catbox.moe/8jni63.png、https://files.catbox.moe/c0zd98.png、https://files.catbox.moe/gw1v45.png、https://files.catbox.moe/9lyidu.png。今後、v3版をリリースし、現在存在するほとんどの署名を除去する予定です。
LoRA: Illust 0.1用にトレーニングされたLoRAは、カスタムTENCの影響で動作しない可能性があります。NoobAI 1.0/1.1または本モデルで直接トレーニングされたLoRAを使用してください。
タグベースの損失スケーリング: NAI v3の実装を模倣し、過学習を防ぐために実装されています。データセット内に過剰に存在するタグの損失は減算され、逆に極めて少ないタグの損失は増加します。
使用のヒント:
ポジティブプロンプト:
masterpiece, best qualityネガティブプロンプト:
low quality, bad hands, greyscale, bad anatomyオプションのネガティブプロンプト:
signature, 4koma, multiple views, watermark, patreon logoSchizoネガティブプロンプト: worst quality, low quality, worst aesthetic, old, early, blurry, lowres, signature, artist name, watermark, twitter username, sketch, logo, furry, text, speech bubble, censored
スタイル設定:
必要に応じて
realistic/3dタグを使用し、ネガティブプロンプトを調整してモデルを望ましいスタイルに導いてください。アーティストリストに含まれるアーティストを活用してください。これらは学習の正則化に使用され、他のデータセットからの知識を失っていません。全コンテンツについて、20エポック後にデータセットは22万枚の元画像から4万枚の厳選画像に縮小されています。
技術的設定:
サンプラー: Euler a, Euler
ステップ数: 20-28
CFGスケール: 5.0-8.0
解像度: 1024x1024、または~~1.048.576ピクセル以内の任意のアスペクト比
モデルの構成:
- 独自のCLIP/TENC設定とU-netアラインメントで開発。
互換性:
- ComfyUIの注意メカニズムカットを使用してNoobai v1.1と同期させることで最適な結果を得られます(PotatCatのガイドに基づく)。
謝辞:
- Arc En Ciel Discordサーバー、@mfcg、@FallenIncursio、@Anzhc、@richyrich515、およびその他の皆様の支援に感謝します!
娯楽用免責事項:このモデルを使用することで、あなたは@novowelsにあなたのバーチャルな睾丸の1つを寄付することに同意したものとみなされます。
最良の結果を得るため、これらの設定をリファージに必ず設定してください。

SDXLモデルには「Emphasis mode No Norm」を推奨します。

サポートをご希望の場合は、このモデルに「いいね」を押すか、Buzzでチップを送るか、私のKo-fiに寄付をご検討ください。このモデルは8xL40Sでファインチューニングされています。
関連トレーニング情報:
最低22万枚以上の画像でトレーニング。
40エポックにわたるバッチ処理後、合計約~~450万回の実際のステップ数。
有効バッチサイズは、15 x 8 GPU x 6 グラデーション累積(RTX Ada 6000 x8)。
学習率はCompassで6e-6、その後1.5e-5 AdamW。Clip Lは5e-7、Clip GはAdabeliefで4e-7でトレーニング。




















