Crystal Opal - PDXL Checkpoint
详情
下载文件
关于此版本
模型描述
水晶蛋白石是一种备受推崇的蛋白石变种,以其透明至半透明的体色和绚丽的变彩效应而闻名,其色彩仿佛从宝石内部散发光芒。“水晶”一词并非指蛋白石的结构(因为蛋白石是非晶质而非晶体),而是形容其透明度以及光线穿透宝石的程度。由于其鲜艳而常具空灵的外观,水晶蛋白石是最受追捧的蛋白石之一。
为何将此模型命名为“水晶蛋白石”?
艺术品的美感很大程度上源于与光线的互动——光线与阴影在多个方向上散射与折射,形成动态的变彩效果,并随观察角度的改变而变化。水晶蛋白石与“水晶蛋白石”模型正具备这一共性。我希望打造一个半写实模型,既能灵活运用光影效果,又在风格上保持高度可塑性,因此在命名上选择了相似的美学理念。
它是如何制作的?
“水晶蛋白石”由多个经过PDXL训练的模型及其融合结果合并而成,目标是结合写实、CGI与艺术风格。遗憾的是,由于该模型是在另一台已无法使用的电脑上创建的,我无法提供确切的融合参数。但我确信其基础模型为Zovya的Everclear PNY(很可能是V2版本)。融合后的成果曾用于收集反馈,近期有用户要求公开该模型,因此我在此上传。
基础模型致谢:/model/341433/everclear-pny-by-zovya
Zovya的Everclear PNY是一款卓越的模型,能够生成PDXL系列中最出色的写实效果,我强烈推荐您体验!
水晶蛋白石的局限性是什么?
手部和眼睛等细节在远距离时容易丢失。我通常通过使用Adetailer、增加采样步数或在高分辨率修复中提升图像尺寸来修正。多个角色互动时,细节往往相互混淆。由于该模型被强烈地以booru标签引导,当不同角色的标签冲突时(例如“蓝发,棕发”),常导致角色特征错乱或效果共享。在Automatic1111中使用BREAK分离提示词似乎有所帮助,而区域提示扩展则可通过指定提示词在图像中的应用位置来解决此问题。我计划未来训练多角色概念,以期从根本上克服这一挑战。
水晶蛋白石的核心特性:
灵活性:该模型对同时使用多个LoRA具有较高容忍度,一般在两个以内不会产生伪影;若模型未过度“烘焙”,即使在较低权重下,也可使用大量互补LoRA。模型支持高CFG配合高步数,或低CFG配合低步数。请自行实验探索其潜力。与其他PDXL模型一样,该模型具备生成NSFW内容的能力,因其掌握了男女解剖结构知识。
角色表现:模型重点训练了角色理解能力,可识别来自电子游戏、CG电影及部分动漫的角色。虽然其理解大量动漫与电影角色的能力有限,但我计划未来改进这一表现。它能识别来自《尼尔》系列、《守望先锋》、《英雄联盟》、《魔兽世界》、《死或生》、《Fatal Fury》、《忍者龙剑传》、《RWBY》等作品的角色与风格,列表仍在持续增加……
默认行为:无需使用正面美感提示词即可获得良好结果,但模型对此类提示响应积极。除非你希望消除其默认生成的某些内容,否则通常无需负面提示。仅提供角色提示而无其他上下文时,模型通常会生成角色居中、面向观众、背景简单的构图。与多数模型类似,该模型偏向生成人类与女性形象,但在被明确提示时,也能生成男性与非人类角色。
如何使用水晶蛋白石:
VAE:VAE已内嵌,但您可自由使用任何兼容SDXL的VAE。
采样器:模型兼容大多数采样器。我偏好使用Euler A和DPM++ 2M。请参阅下方测试结果,了解不同采样器的表现。
CFG与步数:在20步下,CFG值在4至10之间可稳定运行。若CFG值较高(约20),建议增加步数(40+)以避免伪影;若步数较低(约8),则应降低CFG值(约4)以防止失真。
尺寸与宽高比:我倾向于使用尺寸超过1000的正方形比例。768至1280的尺寸表现良好,超出此范围易出现变形。通过使用高分辨率修复、图生图和Depth Control Net,可生成更大尺寸图像。只要不偏离推荐范围,标准宽高比(如1:1、4:3、3:2、8:5、16:9及其倒数)均可稳定生成。
提示词:适用于PDXL模型的标准质量提示词(如score_9、score_8_up、source_anime等)效果极佳。该模型最受益于booru标签提示,对复杂语句的理解能力稍弱。应避免相互冲突的提示词。以下提示词可单独或组合使用,以改变生成图像风格:
- Blender(中等程度),
- 动漫截图,
- 写实、超写实,
- 游戏CG,
- 景深虚化、模糊背景,
- 单色,
- 彩色、色彩丰富,
测试与示例:
15步与30步采样器网格:
15步
30步

高CFG高步数
低CFG低步数

备注:
我并非专家,有许多人掌握更优的知识、工具与技术用于训练与融合模型。我正在探索与学习,因此非常欢迎任何反馈、技巧与建议。









