AstolfoXL
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
AstolfoXL (1EP)
おそらく最初(そして唯一の)個別 フルファインチューニング で、 マルチGPUを用いたもの。
Discord: "Good luck".
仕様
ベースモデル: AstolfoMix-XL、バージョン 255c
テクニカルレポート: ch06
学習メトリクス(tensorboard): HF
データセット(画像 > レイテンツ): danbooru2024, e621_2024
データセット(タグ + キャプション): meta_lat.json
1ステップ = 16枚の画像、4x RTX 3090 24G。
1EPで778kステップ、8.0 + 4.6 = 1260万枚の画像
タグ + NLPキャプションにA1111トークントリックを使用
トレーナーコード: PRはマージされません
学習パラメータ: adamW8bit、UNET 1.5e-6、TE 1.2e-5、BS4(4GPU)grad accu 4、71% UNET(速度重視、アンダーフィット必須)
1EPに75–100日以上を要する。1EPのみ学習。10kステップごとに保存。
学習結果と損失曲線: HFのTensorboard
核心的コンセプト: 非教師学習
期待される出力: MID(100%フィルタ不要、品質タグ不要)または「現実的」
使用方法
LoRAを学習 またはこのモデルの上にマージ。互換性は215cに近いまま。現実的な人間コンテンツも依然としてサポートされています。「信じてください、兄弟」
アーティストタグは機能しない可能性がありますが、私は学習しました。お手持ちの「NAI」プロンプトをそのままお使いください。
TIPO を使用して、NLPでタグベースのプロンプトを拡張してください。
短いタグは背景のレイテンツノイズの影響を受けやすいです。タグはE621またはdanbooruから確認できます。
すべての画像は1回だけしか見られていません。追跡するタスクやKPIはなく、全知の状態はすでにアーカイブされています。損失曲線は、収束も発散もしていないように、非常に平坦です。
完全なドキュメンテーションは公開予定で、AstolfoMixシリーズと同等の長さになります。



















