MyMIX-G/Jem

详情

下载文件

模型描述

描述

实验性 LoRA 微调混合模型。可能不符合你的口味,请勿用于商业用途,但可以自由 remix。负向嵌入并非必需,但可能有所帮助。

这是对 Gyozamix 的深度修改版本。以下是各模型之间的简要差异:

  • MIX-GEM-T1:目标是类似油画布的质感。这是一个非常原始的 LoRA 微调,仅将两个训练好的画风 LoRA 以主次比例混合。其框架大多是临时拼凑的,源于一次随机混合,却意外获得了不错的效果。对提示词响应尚可。

  • MIX-GEM-T2(又称 EternalWinter):基于早期的油画质感微调,进一步优化以呈现极其细腻的视觉风格。其中隐约可见 Galko 和铃木健也的漫画家风格,因此在眼睛和睫毛处呈现出极为精致的细节。

  • MIX-GEM-T2A(未上传):T2 的进一步优化版本。整体细节更丰富,对比度更高。

  • MIX-GEM-T3:由于合并过程中的某些异常,以及未能妥善调整合并素材,该模型带有强烈的卡通风格。它失去了 T2 的一些精致感,但获得了更夸张的特征。虽然这是一个值得研究的方向,但并非我的偏好,因此我没有继续深入。

  • MIX-GEM-T2_2:对 T2 的全面重构。本质上是 MIX-GEM-T3 的配方,但修正了导致 T3 过度卡通化的不平衡问题。并通过 CLIP 交换进一步增强对提示词的服从性。

我常使用来自 此处 的 LoRA 来调整输出结果。角色、服装和姿态 LoRA 均适用。由于该模型本身已具备鲜明风格,我不认为有必要使用风格 LoRA。它并非为通用性设计,如需多功能,请使用 Based66、AuroraOne 或 Amedira。

本模型无 HuggingFace 仓库,配方(如我提供)见侧边栏。

SDXL 更新 2024年4月15日

我们又回到 SDXL 了,哈哈。抱歉 @penterised,我骗人了,哈哈。目前使用 Pony,因为我的最爱画师尚未在 AnimageXL 上训练:

  • MIX-GEM-WXL-D2nai:以 Pony Diffusion for Anime 为基础。Worldly_XL 在基础层面上进行补偿,以弥补 Pony 在背景上的不足。它对 LoRA 兼容性良好。我曾考虑将其发布为 T(口味)版本,但 NovelAI 可能是唯一能依靠模型内在风格生存的 SDXL 模型,你应该直接使用 LoRA 来弥补局部缺陷。

    • MIX-GEM-WXL-D2naiK:D2nai 的变体,已内嵌风格 LoRA。仍兼容其他风格 LoRA。
  • MIX-GEM-WXL-ZA1:又称 ChromeshineXL。它延续了 D2naiK 的内在风格赋予方式。相比 D2nai,其主要优势在于改进了光照效果,并对机器人女孩和怪物女孩(尤其是半人马)的概念识别更佳。它进一步远离了 D2nai 的写实倾向,所需移除写实性的提示词数量也进一步减少。

  • MIX-GEM-LXS-QromEW:此版本脱离了 Pony Diffusion for Anime 基础。我尚不确定这是偶然尝试,还是未来趋势。它基本专为单一风格而建,表现尚可。它使用 ChromelightXL,该模型从 MIX-GEM-WXL-ZA1 中提取,但与 MIX-GEM-XL 系列其余部分无其他关联。这可能是一条死胡同分支,但我感觉 LS Eqos 是一个强大而通用的基础模型,或许存在并行演化。此模型应完全不响应风格 LoRA。

  • MIX-GEM-LXS-ZA1(未上传):尝试将 ChromeshineXL 的独特特质迁移到 LS Equos 上,但效果不佳。相比之下,LS Equos + ChromeLightXL 表现更好。与 ChromeshineXL 相比,此版本水印更少、背景更佳、姿态更动态,但严重丧失了角色间互动的理解能力,光照与色调大幅下降。

    • MIX-GEM-XLS-ZA1.trainD:最终将 D2nai 的初始差异训练到 LS Equos 上并合并完成微调。这就是 ChromeshineXL_MP。实际模型页面提供了更多对比细节,简言之,它更易用、对 LoRA 更宽容,但牺牲了部分构图感知力。
  • Adam8wit-QEgooW:侧边栏的说明远比本页详尽,但本质上这是对 PonyXL T2_2 LyCORIS 的彻底重构尝试。它极为干净,肤色与光影表现优异,背景(对 Pony 而言)也相当不错,但容易偏向 2.5D 风格。我的建议是尽可能搭配角色 LoRA 来缓解过度 2.5D 的倾向。当然,如果你喜欢这种风格,那就尽情使用吧。可与 ChromelightXL 结合,重新获得“御姐脸”效果。

NAI-XL 更新 2025年1月11日

我个人不认同基于 Illustrious 的风格混合,因为 Illustrious 的文本编码器远不如 Pony 那样“烂”。不过,我目前正实验 Itercomp 和 Cyberfix,因为我会将它们合并至基础模型以提升构图感与整体解剖结构,因此我也想看看效果如何。

目前我的结论是:它们作为基础模型表现相当出色,但作为风格模型则非常糟糕。

  • XLVpred06:以 LHC (Large Heap o' Chuubas) 为基础,而 LHC 本身又以 NAI-XL vpred06 为基础。老实说,我选择 LHC 而非直接用 NAI-XL,仅仅是因为我删掉了 vpred06 以腾出磁盘空间,但它表现相当不错,并在角色知识上扩展了基础 NAI-XL。此模型比以往任何时候都更接近 SD1.5 版本,且基于比 PonyXL(本就问题重重)好得多的 SDXL 基础。

    • XLVpred06DOUBLEcompfixed:顺便说一句,我不如 XLVpred06 那样喜欢这个风格。但我研究这个合并的主要原因就在于此。相较于 XLVpred06,该版本经历了两次合并:首先与 Itercomp 垂直合并以提升风格与构图;再与 Cyberrealistic 和 Cyberillustrious 垂直合并以改善解剖结构。Itercompfix 版本同时融合了 Cyberrealistic 和 Cyberillustrious-fixed 的版本,最终两者再合并成 DOUBLEcompfixed 版本。总体而言,它在手部等细节上获得了更多提升,但风格被稀释了。我计划对 Noob 本身也尝试相同方法,由于它本身就是基础模型,风格稀释的影响会小得多。
  • XLBD1:以 Better Days. Illustrious v0.1 为基础,具体为一个重合并版本:betterDaysIllustriousXL_V01ItercompPerpCyberillustfixPerpWeightedSum05,采用 XLVpred06DOUBLEcompfixed 方法的简化版。如果你对无 LoRA 合并时的表现感兴趣,可在此处下载:此处此处。它本质上是 Better Days,但灯光有所改进,棕褐色调大幅减少。我在此处发布了 x/y 对比图:此处。此版本因基于 eps 基础模型而命名。

此模型生成的图像

未找到图像。