Initium | Finetune | NoobAI Epsilon 1.1
详情
下载文件
模型描述
Initium(SDXL、IllustriousXL): 什么是Initium?
- 基于Noobai V1.1构建,该模型旨在“修复”NoobAI 1.1中遗留的一些问题,适合作为创建您自己的合并模型的基准,理想情况下可作为具有相同传承背景的合并模型的训练基础。
功能:
自定义训练的文本编码器:包含独特的CLIP/TENC训练及与之对齐的U-Net。
数据集:使用~~22万张图像数据集(lucereron + Initium v1数据集 + 新数据)进行训练,该数据集并非仅专注于“单女孩”题材,旨在生成多样化的场景、抽象内容及无人物图像,对女性的偏向性略低。训练中使用了以下艺术家列表,请记得使用转义字符如
sen \\(astronomy\\),许多艺术家的样本可见于此:https://files.catbox.moe/9lglyd.png、https://files.catbox.moe/4earj9.png、https://files.catbox.moe/b5egkz.png、https://files.catbox.moe/timjci.png、https://files.catbox.moe/8jni63.png、https://files.catbox.moe/c0zd98.png、https://files.catbox.moe/gw1v45.png、https://files.catbox.moe/9lyidu.png。后续将推出v3版本,以尽可能去除现有签名。LoRA:在Illust 0.1上训练的LoRA可能因自定义TENC而不兼容,建议使用NoobAI 1.0/1.1或直接在本模型上训练的LoRA。
基于标签的损失缩放:模仿NAI v3的实现方式,以避免过拟合;当某些标签在数据集中出现频率过高时,其损失值将降低;反之,若某标签几乎未出现,则其损失值将被提高。
使用建议:
正向提示词:
masterpiece, best quality负向提示词:
low quality, bad hands, greyscale, bad anatomy可选负向提示词:
signature, 4koma, multiple views, watermark, patreon logoSchizo负向提示词:worst quality, low quality, worst aesthetic, old, early, blurry, lowres, signature, artist name, watermark, twitter username, sketch, logo, furry, text, speech bubble, censored
风格设定:
根据需要使用
realistic/3d标签,并调整负向提示词以引导模型趋向您期望的风格。使用艺术家列表中的艺术家名称,因为这些艺术家在训练中被用作正则化手段,从而保留了从其他数据集中学习到的知识。所有内容在20轮训练后数据集被缩减,从原始22万张图像筛选为4万张精选图像。
技术设置:
采样器:Euler a, Euler
步数:20-28
CFG比例:5.0-8.0
分辨率:1024x1024,或任何像素总数不超过~~1,048,576的宽高比。
模型配方:
- 使用定制的CLIP/TENC设置与U-Net对齐技术开发。
兼容性:
- 与Noobai v1.1同步使用,在ComfyUI中启用注意力裁剪(由PotatCat指导),以获得最佳效果。
致谢:
- 感谢Arc En Ciel Discord服务器、@mfcg、@FallenIncursio、@Anzhc、@richyrich515及其他支持者!
免责声明(仅供娱乐):使用本模型即表示您同意向@novowels捐赠一个虚拟睾丸。
为获得最佳效果,请在您的重铸设置中启用以下选项。

建议SDXL模型使用“Emphasis mode No Norm”。

如您希望支持我,欢迎点赞本模型,或通过Buzz打赏/捐赠至我的Ko-fi,本模型使用8张L40S显卡微调而成。
相关训练信息:
使用至少22万张图像进行训练。
经过40轮训练、批量处理后,总计约~~450万次真实步数。
有效批量大小为 15 x 8 GPU x 6 梯度累积(RTX Ada 6000 x8)
学习率初始为6e-6(使用Compass),后改为1.5e-5(AdamW);Clip L学习率为5e-7,Clip G使用Adabelief以4e-7学习率训练。




















