FLUX.2 [klein] AIO
详情
下载文件
关于此版本
模型描述
🚀 FLUX.2 [klein] 4B AIO | 子秒级图像生成
超快 • 4-6 步 • 文本到图像 + 图像编辑 • 全功能 • Apache 2.0
✨ 什么是 FLUX.2 [klein] 4B AIO?
FLUX.2 [klein] 4B AIO 是 Black Forest Labs 最新紧凑型图像生成模型的全功能整合版本。此版本将 VAE、文本编码器(Qwen3)和 UNet 集成于单个文件中——直接加载即可使用!
“Klein” 在德语中意为“小”,但该模型性能远非有限。它在文本到图像、图像编辑和多参考生成方面表现出色,而这些能力通常仅存在于更大模型中。
📦 可用版本
🟡 FP8-AIO(约 7.7 GB)——推荐给大多数用户
- 精度:FP8
- UNet:FP8
- 文本编码器:FP8
- VAE:BF16
- 最适合:大多数用户、快速测试、日常使用、最低显存需求
🔵 FP16-AIO(约 15 GB)——适用于旧显卡
- 精度:FP16
- UNet:FP16
- 文本编码器:FP16
- VAE:BF16
- 最适合:旧显卡(GTX 10xx、RTX 20xx),兼容性最广
🟢 BF16-AIO(约 15 GB)——最高画质
- 精度:BF16
- UNet:BF16
- 文本编码器:BF16
- VAE:BF16
- 最适合:RTX 30xx/40xx/50xx,专业/商业用途
🎯 主要特性
- ⚡ 4-6 步生成——在现代硬件上实现亚秒级推理
- 📦 全功能整合——无需单独下载 VAE 或文本编码器
- 🎨 统一架构——T2I、I2I 编辑与多参考生成一体化
- 📐 原生 1024×1024 分辨率——专为此分辨率优化
- 💾 低显存占用——轻松运行于消费级显卡
- 📜 Apache 2.0 许可证——完全开放用于商业用途!
- 🔧 LoRA 兼容——基础版本非常适合微调
⚙️ 推荐设置
- 步数:4-6(已步数蒸馏,更多步数 ≠ 更好)
- CFG:1.0 ⚠️ 关键!
- 采样器:euler
- 调度器:simple(或 "normal")
- 分辨率:1024×1024(原生)
⚠️ 关键提示:CFG 必须设为 1.0!
这是一个经过蒸馏的模型,专为 CFG 1.0 优化。更高的 CFG 值将导致更差的效果!
✅ CFG 1.0 = 正确
❌ CFG 3.5+ = 错误,效果会变差
其他说明
- 4-6 步为最佳——模型经过步数蒸馏以实现快速推理
- 无需负面提示——可用但非必需
- 自然语言提示——直接描述你想要的画面即可
📥 安装(ComfyUI)
快速入门
- 下载你选择的版本(FP8/FP16/BF16)
- 放置到
ComfyUI/models/checkpoints/ - 加载使用“Load Checkpoint”节点
- 生成!
文件夹结构
ComfyUI/
└── models/
└── checkpoints/
└── flux-2-klein-4b-bf16-aio.safetensors (或 fp16/fp8)
🎨 示例提示词
照片级真实感
一张专业照片,展示一位咖啡师在温馨的咖啡馆制作拿铁拉花,晨光透过窗户洒入,浅景深,使用索尼 A7III 拍摄
数字艺术
一条威严的巨龙盘踞在水晶山峰之巅,背景为极光,奇幻数字绘画,高度精细的鳞片,戏剧性光影
产品摄影
一款奢华香水瓶置于白色大理石上的极简产品摄影,影棚灯光,反射效果,商业摄影风格
💻 能力范围
✅ FLUX.2 [klein] 4B 可实现:
- 文本到图像(T2I)——从文本生成高质量图像
- 图像到图像(I2I)——单参考图像编辑
- 多参考生成——通过多个输入图像实现可控变换
- 文本渲染——图像中文字渲染效果提升
- 照片级真实感——专业级照片质量
- 艺术风格——多样化的艺术风格表现
⚠️ 局限性:
- 优化用于 1024×1024 分辨率(其他分辨率可用但非最优)
- 4B 模型——在复杂场景中细节略少于更大模型
- 蒸馏版本——输出多样性低于基础模型
🔧 技术细节
- 参数量:40 亿
- 架构:校正流变换器(Rectified Flow Transformer)
- 文本编码器:基于 Qwen3
- 推理步数:4-6(步数蒸馏)
- 原生分辨率:1024×1024
- 精度:BF16 / FP16 / FP8
- 许可证:Apache 2.0
🆚 对比:4B 与 9B
FLUX.2 [klein] 4B
- 参数量:4B
- 显存:约 8-13 GB
- 显卡:RTX 3090/4070+
- 画质:非常好
- 许可证:Apache 2.0 ✅
- 商业用途:支持!
FLUX.2 [klein] 9B
- 参数量:9B
- 显存:约 29 GB
- 显卡:RTX 4090+
- 画质:优秀
- 许可证:非商业 ❌
- 商业用途:不支持
→ 4B 版本适合:消费级硬件、商业项目、快速迭代
❓ 常见问题
Q:我需要单独下载 VAE/文本编码器文件吗?
不需要!AIO = 全功能整合,所有内容均包含在单个文件中。
Q:我能用于商业项目吗?
可以!4B 版本采用 Apache 2.0 许可证。
Q:为什么只用 4-6 步?
该模型经过步数蒸馏,增加步数不会提升画质。
Q:为什么 CFG 必须设为 1.0?
这是专为 CFG 1.0 优化的蒸馏模型,更高的值会降低输出质量。
Q:FP8 和 BF16 有什么区别?
FP8 更小更快,BF16 画质略优。对大多数应用而言,FP8 已足够。
Q:是否支持 LoRA?
支持!特别是基础版本(非蒸馏)非常适合 LoRA 训练。
Q:与 9B 版本有何不同?
9B 画质更好,但仅限非商业用途;4B 是 Apache 2.0 开源许可!
🐛 排障指南
图像“褪色”或过度饱和
- 检查 CFG —— 蒸馏模型必须设为 1.0!
- 使用 4-6 步
文本渲染效果差
- 在提示词中更具体
- 使用简单、简短的文本
- 将文本要求置于提示词开头
颜色异常
- 尝试使用 BF16 版本而非 FP8
- 确保显示器已正确校准
🙏 致谢
原始模型:Black Forest Labs
架构:校正流变换器
文本编码器:Qwen3
AIO 整合版:SeeSee21
官方链接:
📋 更新日志
v1.0(2026 年 1 月)
- 首次发布
- 提供 BF16、FP16 和 FP8 版本
- 全功能整合:含 VAE + 文本编码器 + UNet
许可证:Apache 2.0 —— 个人与商业用途均免费!🎉
ComfyUI 上最快的开源图像生成模型! ⚡
立即下载,开始创作! 🚀



















