データセット:キャラクター作成スクリーンショットツールでゲーム内から取得した121枚の画像
モデル INZOIV1A の概要:
- ベースモデル:Stable Diffusion v1-5
- LoRAタイプ:標準、LyCORISプリセット(フル)
- 精度:fp16
- 最適化手法:Adafactor、SNRスケジュール付きハーバー損失
- 解像度:768x768、256–2048の間でバケット化
- 学習:
- エポック:8回、4回ごとにサンプリング
- データセット内画像数:121枚
- バッチサイズ:3、勾配蓄積:1
- 学習率:0.0001(UNetおよびテキストエンコーダー)
- 適応ノイズ:マルチレゾリューションノイズディスカウントを0.3、元のノイズオフセット
- 出力:
- 形式:bf16 safetensors
- サンプリング:Euler-A、プロンプト「inzoi style, a man」および「inzoi style, a woman」