AnyNoobAI(for LoRA Training)
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
LoRA学習用に修正されたNoobAI-XL。
意図しない画風の変化を抑制します。
画像生成には適していません。
文字/コンセプト向け推奨学習パラメータ(sd-scripts)
バッチサイズ: 2
解像度: 1024
アスペクト比バケティングを有効化: はい
最小/最大バケット解像度: 512/2048
次元(Rank): 4-16
Alpha: dim × 0.25
オプティマイザ: RAdamScheduleFree(LR=0.0004) または CAME(LR=8E-05)
ステップ数: 1000-1400
Conv2dを学習: いいえ
FP8ベース: はい(<12GB VRAM用)
使用しないでください:
--noise_offset, --zero_terminal_snr
必須(v-predictionのみ):
--v_parameterization
注意:
Civitaiのオンライン学習ツールはv-predictionをサポートしていません。
LoRA学習用のNoobAI-XLです。
意図しない画風の変化を軽減し、精度が向上します。
これでLoRAを作る場合、「--noise_offset」と「--zero_terminal_snr」は使用しないように。
v-prediction版でLoRAを作る場合、「--v_parameterization」を設定してください。
また、noise offsetの効果を打ち消したため、マージ用途の使用は推奨しません。
なお、NoobAI-XLの成分が薄いマージモデルではLoRAの効果が低下します。
copycatやparuparuなどのNoobAI-XLの成分が薄いcheckpointで使用する予定なら、AnyIllustriousで学習するほうが良いと思います。
原理は不明ですが、画風を平均値に近づけ、多様性を高めることでデータセットの画風を吸収してしまうものと思われます。精度についてはZero Terminal SNR無効化により改善を確認しています。
学習情報:
sd-scriptsで二回DoRAの学習とマージを繰り返すことでファインチューンされました。
データセット情報:
データセットサイズ: Gelbooruからの5120枚の画像
2024年9月4日にGelbooruから新着順に収集した5120枚の画像で学習しました。
以下のタグが含まれる、または条件を満たす画像は除外しました。
filetype:gif, score:<0, mpixels:<1048576, tagcount:<16, \*_artifacts, adversarial_noise, greyscale, monochrome, digimon, photophop_(meidum), ai-generated, duplicate, bad_\*, off-topic, cropped, resized, reversed, rotated, third-party_edit, screenshot, tagme, real_life, watermark, 3d, koikatsu_(medium), mikumikudance, twitter_username
学習スクリプト(ソースコード)
注意/おしらせ:
このモデルはFair AI Public License 1.0-SD(https://freedevproject.org/faipl-1.0-sd/)でライセンスされています。
このモデルを改変する場合、変更点および元のライセンスを明記する必要があります。


