AnyNoobAI(for LoRA Training)

詳細

ファイルをダウンロード

モデル説明

LoRA学習用に修正されたNoobAI-XL。

意図しない画風の変化を抑制します。

画像生成には適していません。

文字/コンセプト向け推奨学習パラメータ(sd-scripts)

バッチサイズ: 2

解像度: 1024

アスペクト比バケティングを有効化: はい

最小/最大バケット解像度: 512/2048

次元(Rank): 4-16

Alpha: dim × 0.25

オプティマイザ: RAdamScheduleFree(LR=0.0004) または CAME(LR=8E-05)

ステップ数: 1000-1400

Conv2dを学習: いいえ

FP8ベース: はい(<12GB VRAM用)

使用しないでください:

--noise_offset, --zero_terminal_snr

必須(v-predictionのみ):

--v_parameterization

注意:

Civitaiのオンライン学習ツールはv-predictionをサポートしていません。

LoRA学習用のNoobAI-XLです。

意図しない画風の変化を軽減し、精度が向上します。

これでLoRAを作る場合、「--noise_offset」と「--zero_terminal_snr」は使用しないように。

v-prediction版でLoRAを作る場合、「--v_parameterization」を設定してください。

また、noise offsetの効果を打ち消したため、マージ用途の使用は推奨しません。

なお、NoobAI-XLの成分が薄いマージモデルではLoRAの効果が低下します。

copycatやparuparuなどのNoobAI-XLの成分が薄いcheckpointで使用する予定なら、AnyIllustriousで学習するほうが良いと思います。

原理は不明ですが、画風を平均値に近づけ、多様性を高めることでデータセットの画風を吸収してしまうものと思われます。精度についてはZero Terminal SNR無効化により改善を確認しています。

学習情報:

sd-scriptsで二回DoRAの学習とマージを繰り返すことでファインチューンされました。

データセット情報:

データセットサイズ: Gelbooruからの5120枚の画像

2024年9月4日にGelbooruから新着順に収集した5120枚の画像で学習しました。

以下のタグが含まれる、または条件を満たす画像は除外しました。

filetype:gif, score:<0, mpixels:<1048576, tagcount:<16, \*_artifacts, adversarial_noise, greyscale, monochrome, digimon, photophop_(meidum), ai-generated, duplicate, bad_\*, off-topic, cropped, resized, reversed, rotated, third-party_edit, screenshot, tagme, real_life, watermark, 3d, koikatsu_(medium), mikumikudance, twitter_username

学習スクリプト(ソースコード)

sd-scripts

注意/おしらせ:

このモデルはFair AI Public License 1.0-SD(https://freedevproject.org/faipl-1.0-sd/)でライセンスされています。

このモデルを改変する場合、変更点および元のライセンスを明記する必要があります。

このモデルで生成された画像

画像が見つかりません。