FLAN-T5-XXL (Text-Encorder only)
详情
下载文件
模型描述
FLAN-T5-XXL(仅文本编码器)
FP8 和 GGUF 格式以压缩 ZIP 文件分发。请在使用前使用您选择的解压软件解压,或从 Hugging Face 页面下载。
FLAN-T5-XXL 是 T5-XXL v1.1 的微调版本,旨在提升准确性和性能。
原始的 FLAN-T5-XXL 模型可在 Google 的 Hugging Face 页面 上获取。
当与 Flux.1、SD3.5 和 HiDream 一起使用时,将 T5-XXL v1.1 替换为 FLAN-T5-XXL 可带来更强的提示理解能力和更佳的图像质量。
本模型已精简,仅提取了文本编码器部分,使其更适用于图像生成工作流。
模型变体
+------------+--------+----------+-----------+
| Flan-T5xxl | Size | Accuracy | Reccomend |
+------------+--------+----------+-----------+
| FP32 | 19 GB | 100.0 % | 🌟 |
| FP16 | 9.6 GB| 98.0 % | ✅ |
| FP8 | 4.8 GB| 95.3 % | 🔺 |
| Q8_0 | 5.1 GB| 97.6 % | ✅ |
| Q6_K | 4.0 GB| 97.3 % | 🔺 |
| Q5_K_M | 3.4 GB| 94.8 % | |
| Q4_K_M | 2.9 GB| 96.4 % | |
+------------+--------+----------+-----------+

使用说明
将下载的模型文件放置在以下任一目录中:
models/text_encodermodels/clipModels/CLIP
在您的工作流中,选择此模型替代标准的 T5-XXL v1.1 模型。
FP32 格式
FP32 格式提供最高的图像质量。
Stable Diffusion WebUI Forge
要使用 FP32 格式的文本编码器,请在启动 Stable Diffusion WebUI Forge 时添加 --clip-in-fp32 参数。
ComfyUI
您也可以通过在启动时启用 --fp32-text-enc 参数,使用 FP32 文本编码器以获得最佳效果。
ComfyUI 中的 GGUF 格式
截至 2025 年 4 月 13 日,ComfyUI 默认的 DualClipLoader 节点已包含设备选择选项,允许您选择模型加载位置:

cuda→ 显存cpu→ 系统内存
由于 Flux.1 的文本编码器体积较大,将设备设置为 cpu 并将模型存储在系统内存中通常能提升性能。
除非您的系统内存低于 16GB,否则将模型保留在系统内存中比使用 GGUF 量化更有效。因此,对于大多数用户而言,由于内存充足,GGUF 格式在 ComfyUI 中收益有限。
在 ComfyUI 中运行 Flux.1 时,请使用 FP16 或 FP32 文本编码器。
对比
小贴士:同时升级 CLIP-L
为获得更佳效果,建议将 FLAN-T5-XXL 与升级版的 CLIP-L 文本编码器搭配使用:
LongCLIP-SAE-ViT-L-14(仅限 ComfyUI)
将 FLAN-T5-XXL 与增强版 CLIP-L 模型结合,可进一步提升图像质量。
许可证
本模型基于 Google 的 FLAN-T5-XXL,同样采用 Apache 2.0 许可证。
更新历史
2025 年 8 月 22 日
新增“为何使用 FP32 文本编码器?”部分。
2025 年 7 月 24 日
重新上传 GGUF 模型,减小模型体积,并修正元数据。


