Emolution15

详情

下载文件

模型描述

SD1.5 新测试模型(使用epsilon-scaling)训练 2048px 32000步 "EmoNAVI"


| 推荐设置 | ※ 此为仍在训练中的演示模型
epsilon-scaling:1.02(A1111・forge 不支持/需使用 reforge 等最新版本)
分辨率为 960 x 1280px 或以下(或使用 Kohya-HiRES)
DPM++ 2M SDE SGM Uniform、CFG:5、Clip skip:2
EmolutionVAE:模型内置/混合微量 EQ-VAE(SDXL)的 840000 版本


本模型使用 EmoNAVI 对以往创建的 SD15 模型进行实拍图像训练。
通过 2048px 分辨率训练,高分辨率区域已可实用至约 1280px。
(请务必使用 epsilon-scaling;更高分辨率可通过 Kohya-HiRES 实现)
在使用 e-pred 的同时应用 ZtSNR,可输出纯黑与纯白,色域也得到扩展。
VAE 在默认的 840000 基础上,微量融合了 SDXL 的 EQ-VAE 进行整合,并在训练时也使用此新 VAE。

为规避 SDXL 的 Clip-G 填充问题,同时保持较低 VRAM 负载,
本项目重新激活了 SD15。


| 训练概要 | 概要如下:
旧 Emolution 模型(fp8 加载)、EmoNAVI(constant)、5e-5、bf16、2048px
EmolutionVAE(混合微量 EQ-VAE(SDXL)的 840000 版本)、全层 LoRA(c3lier)
e-pred、ZtSNR(Debiased-Estimation)、Huber-SNR、R16・8/A16・8
※ 使用 EmoNAVI 时,具备动态 Rank、动态 Alpha 等功能,为 SVD 系列的上位替代方案


鉴于未来可能在 APU(内置 GPU)、NPU、移动设备等环境中进行图像生成的需求,
SD15 环境可能变得重要,因此本项目主要致力于提升其高分辨率性能。
我们将利用与 SD15 早期发布时不同的现代训练方法对其进行更新。
若您认同本项目,请给予“点赞”等支持。
若您愿意协助训练,请参考上述训练概要,制作 LoRA 等相关内容。


关于 EmoVAE,请先查阅:https://civitai.com/posts/23602506
视觉上,我认为 EmoVAE 在 560000 VAE 和 840000 VAE 之间取得了很好的平衡。
请放大观察:高光部分偏向 560000,阴影部分偏向 840000,色域更广。
对比画面左侧书架上书籍白色区域的文字部分:
560000 VAE 的文字近乎消失,而 EmoVAE 和 840000 VAE 仍保留细节。
请关注画面右下角床或沙发侧面的图案:
840000 VAE 的灰色过重导致图案几乎消失,而 EmoVAE 和 560000 VAE 仍保留细节。
因此,每种 VAE 各有优劣,最终请根据个人偏好选择。

此模型生成的图像

未找到图像。