CLIP Text Encode And Enhance
详情
下载文件
模型描述
版本 4 更新:
进行了小规模的代码优化。由于计算负载高、效率低,删除了提示向量和上下文向量之间的角度计算。可以通过设置 “mean” 来禁用上下文向量。添加了第二个输出,旨在连接到 “negative” 输入,并包含一个介于提示向量和上下文向量之间的向量。
版本 3 更新:
注意:现在,通过 clip 连接任何东西时,CFG 必须缩小 2-2.5 倍才能正常工作。修正了提示符中没有分隔符时的一个错误。新增了三个影响 GPT 生成的单词的唯一性和可重复性的设置。用来自 FredZhang7 的 distilgpt2-stable-diffusion-v2 替换了 GPT 模型(权重略低,种类略多)。在 GPT 中,提示语是不带停顿词(冠词、连词、代词)的。在张量形成阶段,提示本身的矢量和中心矢量乘以它们之间夹角的余弦值被连接起来。这样,我们不仅考虑了提示语,还考虑了其上下文以及它们之间的语义接近性。
版本 2 更新:
修正了将文本转换为输入法时的一个错误。添加了禁用 GPT 的选项。更改了默认设置。简化了无用和重复的字符串有效性检查。指示 GPT "Please continue with the descriptive prompt: "。来自 GPT 的续行符会被截断到最后一个逗号,以避免在半字处换行。
版本 1:
对文本编码器进行了一些修改,以改善编写提示符的体验。
引入新的运算符">",其功能类似于 BREAK 运算符或截止扩展。它将提示语的语义部分相互分离。例如,"蓝色头发 > 绿色眼睛 "更有可能生成蓝色头发,而不是绿色或蓝绿色头发。提示语中此类运算符过多会导致生成质量下降。超过 75 个提示符限制的提示符也可以用同样的方法分割成更小的部分。
内置的 GPT-2 模型可帮助编写提示符的结尾。为确保正确工作,包含模型的文件夹必须位于节点文件夹中。所使用的模型是来自 Ar4ikov 的 gpt2-pt-2-stable-diffusion-prompt-generator 模型,但你也可以将模型更改为其他任何模型,甚至自行训练。有四种设置:seed — 可以是固定的;num_beams — 如果多于一个,答案将从多代中选择,这对速度影响很大;max_new_tokens — 最大标记数;do_sample — 如果为 True,下一个标记将在前一个标记的基础上选择。
文本输入窗口的大小可以通过向下拖动节点的右下角来改变。





