CrystaliTIXL

更新：2024年3月3日

完全重新开始。

触发词：cs-cr1stal-v2

此嵌入为生成的图像添加了多彩的玻璃/晶体效果。通常建议在提示词的开头或附近使用触发词。

对于简短提示，通常会得到玻璃雕塑的效果。

对于较长的提示，该嵌入应影响主要主体，可能还有一些次要物体，并可能在各处添加多面宝石。

偶尔会导致主要主体缺失——不知道原因，但我发现其他TI和LoRA也有类似情况。我想这大概就是SDXL的乐趣之一吧 :-)

使用此嵌入时，使用“红宝石”、“紫水晶”、“蓝宝石”等颜色名称通常比直接使用“红色”、“紫色”、“蓝色”等效果更好。

有时嵌入会添加羽毛——不知为何。

权重在 0.8 <---> 1.2 之间效果良好，但在a1111中我几乎不需要调整权重。如果你使用ComfyUI，可能需要上调权重。我不清楚原因，但多位ComfyUI用户告诉我他们普遍需要提升嵌入权重。

我通常使用以下设置：

Euler A 或 DPM++ 2M Karras

宽 x 高：1024x1024 或接近100万像素的组合

30 <---> 50 步

CFG 从 7 <---> 10

高分辨率修复：

使用“Latent（最近邻精确）”缩放，比例在1.25到1.75之间，步数=30，降噪=0.7

可生成极佳图像，但高降噪可能导致变形或重复。

或

使用“4X-UltraSharp”缩放，比例在1.25到1.75之间，步数=30，降噪=0.4

该降噪值足够高，可增加一些细节，又不至于引发过多变形或重复。

模型：

主要在 Crystal Clear XL 模型上测试：

/model/122822?modelVersionId=133832

在 Juggernaut 9、Artium 2、Pixelwave 8、Polyhedron 3 和 ZavyChroma 上也获得了良好效果。

此嵌入与我尝试过的所有LoRA和嵌入搭配使用效果都很好，在一个提示中同时使用多个LoRA与该嵌入也表现良好。

[仅发布于CivitAI]

= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =

更新：2023年9月10日

此嵌入为SDXL生成的图像添加水晶和/或宝石效果。由于步数较少，效果并不细腻，但我希望它能表明SDXL嵌入仍存在尚未开发的潜力。

可下载的“kcrstal17xl-step00002000.safetensors”为2000步，批次=1，使用kohya_ss在50张1024x1024图像上训练而成。如果我能忍受如此缓慢的训练时间，未来将在此页面更新更精细的嵌入。

展示图采用automatic1111 WebUI输出的成对对比：

带嵌入，不带嵌入

展示图使用Crystal Clear XL模型：

/model/122822?modelVersionId=133832

提示词编写有些令人烦恼，或许是因为我对从Stable Diffusion v1.5到SDXL的变化缺乏直观感受。展示图的提示词多为如下形式：

kcrstal17xl analog realistic __art styles 1__ colour photo of a __crystal_test_1__, very detailed, award-winning

通配符 __art styles 1__ 是艺术风格列表，例如“印象派”。

通配符 __crystal_test_1__ 是短语列表，例如“坐在躺椅上的青蛙”。

你可以调高或调低嵌入权重——我通常使用0.6到1.2之间的值。奇怪的是，我发现即使权重为0.1仍能产生明显效果。

= = = = = = = = = = = = = = = = = = = = = = = = = = = = = =

2023年9月3日

这是一个概念验证，而非经过精炼的嵌入。或许它应归类为“文章”而非普通资源页面？

可下载的“kcrstal17xl-step00001200.safetensors”仅训练了1200步，批次=1，基于50张1024x1024图像。如果我能忍受如此缓慢的训练时间，未来将在此页面更新更精细的嵌入。

该嵌入为SDXL生成图像添加水晶和/或宝石效果。由于步数较少，效果并不细腻，但我希望它能表明SDXL嵌入仍存在尚未开发的潜力。

展示图为ComfyUI输出的成对对比：

带嵌入，不带嵌入

以及两组a1111 v1.6.0的混乱输出：

保存的图像，以及“Approx NN”预览的屏幕截图

杂乱的说明……

我对SDXL的输出印象非常深刻，因此希望将我之前为SD v1.5制作的嵌入转换/重制以适配SDXL。

我曾使用automatic1111 WebUI的Train标签制作了CrystaliTI：

/model/135403/crystaliti

我原以为a1111近期的v1.6.0版本会增加SDXL训练功能。结果没有，根据以下讨论来看，也不太可能实现：

https://github.com/AUTOMATIC1111/stable-diffusion-webui/discussions/11857#discussioncomment-6480804

显而易见的解决方案是kohya_ss：

https://github.com/bmaltais/kohya_ss

我从未使用过它，因此其庞大的配置选项让我颇感震撼！我首先尝试在kohya_ss中复刻CrystaliTI。起初并不顺利，但多亏了以下教程，我最终成功了：

https://civitai.com/articles/618/tutorial-kohya-ss-dreambooth-ti-textual-inversion-embedding-creation

向@Desi_Cafe致谢，感谢该教程。

kohya_ss生成的TI当然与我原始的CrystaliTI不同，但足够相似，我对此感到满意。

下一步是更改kohya_ss设置以使用SDXL，并将其指向我的50张训练图像的1024x1024版本。21小时后，kohya_ss完成了2000步中的1240步（批次=1）。

平均每步超过1分钟。 :-(

相比之下，我认为复刻CrystaliTI大约是0.5秒/步。

我原以为（猜测）速度会减慢4到16倍，没想到竟慢了100倍以上：-(

我使用的电脑配置为：

Nvidia 3060/12GB（非Ti版本），Ryzen 7-2700（8核/16线程），64GB系统内存，多个SSD，Windows 10 Pro。

当kohya_ss生成SDXL嵌入时，它占用了3060的全部12GB显存 + 7GB“共享GPU内存”。我猜测使用共享内存（即系统内存）是速度如此缓慢的原因之一？

是否还有更好的kohya_ss设置可以优化？快速搜索发现信息矛盾且不完整。如果有人知道当前kohya_ss中哪些选项有助于降低显存消耗……我洗耳恭听。

kohya_ss设置为每50步保存一次嵌入，因此我已将它们复制到我的备用机器上：2060/6GB，i7-10750H（6核/12线程），16GB系统内存，多个SSD，Windows 10 Pro。在使用--lowvram参数时，它能在a1111 WebUI（v1.6.0）中生成SDXL图像，通常每张图约耗时2分钟。

我在ComfyUI（当前便携版，无自定义节点）中尝试了该SDXL嵌入。

至此，我们发现：创建SDXL嵌入是可行的，但速度极慢。我的预算无力承担4090，因此除非我能找到在3060/12GB上加速生成的方法，否则我恐怕无法制作太多嵌入。

如果任何kohya_ss专家读到了这里，我已在下载中附上了我的配置，希望有好心人能提出哪怕一丁点能提升生成速度的建议。

模型类型	嵌入
基础模型	SDXL 1.0
发布时间	3/3/2024
训练词汇	cs-cr1stal-v2

详情

下载文件

关于此版本

模型描述

此模型生成的图像