FLAN-T5-XXL (Text-Encorder only)

详情

模型描述

FLAN-T5-XXL(仅文本编码器)

FP8 和 GGUF 格式以压缩 ZIP 文件分发。请在使用前使用您选择的解压软件解压,或从 Hugging Face 页面下载。

FLAN-T5-XXL 是 T5-XXL v1.1 的微调版本,旨在提升准确性和性能。

原始的 FLAN-T5-XXL 模型可在 Google 的 Hugging Face 页面 上获取。

当与 Flux.1、SD3.5 和 HiDream 一起使用时,将 T5-XXL v1.1 替换为 FLAN-T5-XXL 可带来更强的提示理解能力更佳的图像质量

本模型已精简,仅提取了文本编码器部分,使其更适用于图像生成工作流。

模型变体

+------------+--------+----------+-----------+
| Flan-T5xxl |  Size  | Accuracy | Reccomend |
+------------+--------+----------+-----------+
|    FP32    |  19 GB |  100.0 % |     🌟    |
|    FP16    |  9.6 GB|   98.0 % |     ✅    |
|    FP8     |  4.8 GB|   95.3 % |     🔺    |
|    Q8_0    |  5.1 GB|   97.6 % |     ✅    |
|    Q6_K    |  4.0 GB|   97.3 % |     🔺    |
|   Q5_K_M   |  3.4 GB|   94.8 % |           |
|   Q4_K_M   |  2.9 GB|   96.4 % |           |
+------------+--------+----------+-----------+

使用说明

将下载的模型文件放置在以下任一目录中:

  • models/text_encoder

  • models/clip

  • Models/CLIP

在您的工作流中,选择此模型替代标准的 T5-XXL v1.1 模型。

FP32 格式

FP32 格式提供最高的图像质量。

Stable Diffusion WebUI Forge

要使用 FP32 格式的文本编码器,请在启动 Stable Diffusion WebUI Forge 时添加 --clip-in-fp32 参数。

ComfyUI

您也可以通过在启动时启用 --fp32-text-enc 参数,使用 FP32 文本编码器以获得最佳效果。

ComfyUI 中的 GGUF 格式

截至 2025 年 4 月 13 日,ComfyUI 默认的 DualClipLoader 节点已包含设备选择选项,允许您选择模型加载位置:

  • cuda → 显存

  • cpu → 系统内存

由于 Flux.1 的文本编码器体积较大,将设备设置为 cpu 并将模型存储在系统内存中通常能提升性能。

除非您的系统内存低于 16GB,否则将模型保留在系统内存中比使用 GGUF 量化更有效。因此,对于大多数用户而言,由于内存充足,GGUF 格式在 ComfyUI 中收益有限。

在 ComfyUI 中运行 Flux.1 时,请使用 FP16 或 FP32 文本编码器。

了解更多 ComfyUI 设置

对比

小贴士:同时升级 CLIP-L

为获得更佳效果,建议将 FLAN-T5-XXL 与升级版的 CLIP-L 文本编码器搭配使用:

将 FLAN-T5-XXL 与增强版 CLIP-L 模型结合,可进一步提升图像质量。


许可证

本模型基于 Google 的 FLAN-T5-XXL,同样采用 Apache 2.0 许可证。


更新历史

2025 年 8 月 22 日

新增“为何使用 FP32 文本编码器?”部分。

2025 年 7 月 24 日

重新上传 GGUF 模型,减小模型体积,并修正元数据。

此模型生成的图像

未找到图像。