SagaXL-ZtnV

詳細

ファイルをダウンロード

モデル説明

SagaXL サガシリーズ (ZtnV) 試験モデル群


サガシティ、知恵、情熱……を解放しよう! RR002以降はEmo系で調整しています。

 SDXL バニラモデル(標準)を ZtSNR(非 V-pred)で訓練し、色域拡大/色調修正を施した後、この XLBB(XL-Base-typeB)を SDXL(標準)へ転移学習し、XLBBP としました。
 ZtnV は ZtSNR かつ non V-pred の意味を持ち、純色表現を可能とし、色彩および色域に優れています。多腕・多脚などの影響はわずかに残存します。
 推奨設定は本説明の最後に記載しています。CFG、解像度などの設定の参考にしてください。サンプル画像の設定値も併せてご参照ください。


SagaXL-RR004 fix は、RR003 emx を修正したモデルです。

 R003をベースに、独自開発のオプティマイザ群(Emo系 EmoFact(v3.0))によるLoRAファインチューニング、極低値AKN(avg_key_norm)と高学習率(LR)による「自己修復」を実施し、モデル名に「fix」を付与しました。
 極低値AKN(avg_key_norm)と高学習率(LR)による「自己修復」は、Emo系で実現可能な特殊効果であり、特にEmo系fact式(fact、zeal等)が得意とする新たな学習法です。簡単に言えば、教師データを参考にテキストエンコーダーなどを最小限の学習で修復します。局所解を最適解に近づけ、汎化性と多様性を付与します。
 これはモデルの特性や性能を引き出し、埋もれた情報や質感を掘り起こすような作用をもたらします。この最適化(修復学習)を実施しました。


SagaXL-RR003 emx は、◆ 失敗作 ◆ でした💦 近々削除予定
 R001をベースに、独自開発のオプティマイザ群(Emo系 EmoLynx(v3.0))によるLoRAファインチューニングを実施し、モデル名に「emx」を付与しました。
 リアル化を試みました。EmoLynxによる精緻化のテストでもあります。陰影などについてリアルさは向上していますが、さらにリアルさを加えたいところです。今回の最終調整である3e-5、3000ステップは若干硬い更新だったかもしれません。次回はもう少し柔らかい更新にしたいと思います。


SagaXL-RR002 enx は、

 R002をベースに、独自開発のオプティマイザ群(EmoSENS系)によるLoRAファインチューニングを実施し、モデル名に「enx」を付与しました。SDXLが持つ可能性を信じられる仕上がりだと思います。使用したオプティマイザはEmo系(第2世代)全種、emosens、airy、catsです。Kohya-scriptのZtSNRも適用しています。


SagaXL-RR002 は、

 R001をベースに、独自開発のオプティマイザ群(EmoNAVI系)によるLoRAファインチューニングを実施し、モデル名に「emx」を付与しました。今回のUPDATEで調整は概ね完了したモデルと認識しています。


SagaXL-RR001 は、

 BeppinXLにBejeanXLを約0.03125の比率で混合し、これをベースにオリジナルコード群(muooonKit)を用いて自己教師強化学習による自己進化を施しました。核となる技術は独自開発のオプティマイザ(Ref-AdamW-mini-ScheduleFree)であり、その他にはSVD応用によるLoRAへの間欠的効果をもたらすコードと、その中心的なコードによるモデル訓練を実施しました。Hako-mikan氏のTrainTrainに、Ref-AdamW-mini、SVD応用の間欠的効果と介入コードを独自実装し、その効果を確認しました。その他コードによるベースモデルの強化も実施しました。


BeppinDX (alpha) は、

 BejeanXLとは別の新しいXLBB-Plus系(派生)を土台としたモデルです。オリジナルコードによるSVD系XLBBPモデルを用い、疑似自己強化学習などを適用しました。


BejeanXL (beta) は、

 すべてのモデルに共通するSDXL(標準)モデルをXLBBPに置換し、土台から色域と色調を改善し、リアルさと緻密さを向上させました。XLBBPを基盤としたモデルです。

 さらに2000枚の画像に対して簡単なFFTを適用し、この新しいBejeanXLに対して、アニメ画像とリアル画像の両方を混合学習したLoRAを適用しました。


推奨設定(Recommended setting):

 CFGスケール:3-7、SDE SGMUniform(ZtSNR / NonVpred)のため、SGMUniformを推奨
 (reForgeではSampler:RES Solver、Schedule:React Cosinusoidal DynSFも良好です)
 解像度:1024x1024以上を推奨、R002以降はmahiro-CFGの使用を避けてください。


SagaXLはお試し用モデルです。商用利用・違法利用はお控えください。

オリジナルコードによる実験的要素により、問題が発生する可能性があります。

何らかの異常や問題が発生した場合は、使用を直ちに停止し、モデルを削除してください。

このモデルで生成された画像

画像が見つかりません。