Veritas

詳細

ファイルをダウンロード

モデル説明

Veritas RR000


illustrious v2.0 を EmoFact v3.6 を用いて複数回の全層LoRAで仕上げました
e-pred + ZtSNR です(v-pred ではありません)、初の IL版 です、EmoFact なかなか良い感じ
粗削りのため、「誰にでも良いモデルではない」と思います

ZtnV(e-pred + ZtSNR)について
Zero Terminal SNR / Debiased Estimation を Kohya-Script で使用しています
epsilon Prediction では発散するといわれますが、emo系は安全に進行します
つまり、e-pred の高い汎化性と ZtSNR の広い色域を両立することが可能です

Flow-Matching(FM)との比較
これは Flow-Matching(FM)を上回る可能性を持つ組み合わせかもしれません
FMは汎化性に乏しく、学習はコピーに近いものになります(構造や色域は正確ですが)
しかし構造の正確性はむしろAttention層の多寡が本質でしょう
汎化性に優れ、samplerの自由度を持つe-predこそ最適ではないでしょうか?

FMの弱点
FM方式は論文では高精度・高収束とされますが、実際には収束しづらいです
それはノイズに弱いためで、わずかな揺れで破綻し、出力結果にも影響を与えます
(e-predはそのノイズを用いて学習するため、ノイズこそ学習の源泉です)
これからは低精度・量子化の時代となり、これはノイズを多く含む学習です
FM方式はこのノイズが学習を妨げるため、基本的に不整合となります


ライセンス
ライセンスについては、元モデル illustrious v2.0 を継承します
ただし、実験的optimizerによるemo系調整版であるため、使用時は注意が必要です
予期せぬエラーを含む可能性があるため、マージやその他の処理については慎重に行うべきです
よって、基本的にillustriousのライセンスを継承しつつ、制限を設けます
マージなどを実施して公開する場合は、上記の注意を明示するようお願いします

このモデルで生成された画像

画像が見つかりません。