数据集:使用角色创建截图工具在游戏中拍摄的121张图片
模型 INZOIV1A 概述:
- 基础模型:Stable Diffusion v1-5
- LoRA 类型:标准,LyCORIS 预设(完整)
- 精度:fp16
- 优化器:Adafactor,带 SNR 调度的 Huber 损失
- 分辨率:768x768,分桶范围为 256–2048
- 训练:
- 迭代次数:8,每4次采样一次
- 数据集包含121张图片
- 批次大小:3,梯度累积:1
- 学习率:0.0001(UNet 和文本编码器)
- 自适应噪声:多分辨率噪声折扣为 0.3;原始噪声偏移
- 输出:
- 格式:bf16 safetensors
- 采样:Euler-A,提示词为 "inzoi style, a man" 和 "inzoi style, a woman"