FLUX.2 [klein] AIO

详情

模型描述

🚀 FLUX.2 [klein] 4B AIO | 子秒级图像生成

超快 • 4-6 步 • 文本到图像 + 图像编辑 • 全功能 • Apache 2.0


✨ 什么是 FLUX.2 [klein] 4B AIO?

FLUX.2 [klein] 4B AIO 是 Black Forest Labs 最新紧凑型图像生成模型的全功能整合版本。此版本将 VAE、文本编码器(Qwen3)和 UNet 集成于单个文件中——直接加载即可使用!

“Klein” 在德语中意为“小”,但该模型性能远非有限。它在文本到图像、图像编辑和多参考生成方面表现出色,而这些能力通常仅存在于更大模型中。


📦 可用版本

🟡 FP8-AIO(约 7.7 GB)——推荐给大多数用户

  • 精度:FP8
  • UNet:FP8
  • 文本编码器:FP8
  • VAE:BF16
  • 最适合:大多数用户、快速测试、日常使用、最低显存需求

🔵 FP16-AIO(约 15 GB)——适用于旧显卡

  • 精度:FP16
  • UNet:FP16
  • 文本编码器:FP16
  • VAE:BF16
  • 最适合:旧显卡(GTX 10xx、RTX 20xx),兼容性最广

🟢 BF16-AIO(约 15 GB)——最高画质

  • 精度:BF16
  • UNet:BF16
  • 文本编码器:BF16
  • VAE:BF16
  • 最适合:RTX 30xx/40xx/50xx,专业/商业用途

🎯 主要特性

  • 4-6 步生成——在现代硬件上实现亚秒级推理
  • 📦 全功能整合——无需单独下载 VAE 或文本编码器
  • 🎨 统一架构——T2I、I2I 编辑与多参考生成一体化
  • 📐 原生 1024×1024 分辨率——专为此分辨率优化
  • 💾 低显存占用——轻松运行于消费级显卡
  • 📜 Apache 2.0 许可证——完全开放用于商业用途!
  • 🔧 LoRA 兼容——基础版本非常适合微调

⚙️ 推荐设置

  • 步数:4-6(已步数蒸馏,更多步数 ≠ 更好)
  • CFG:1.0 ⚠️ 关键!
  • 采样器:euler
  • 调度器:simple(或 "normal")
  • 分辨率:1024×1024(原生)

⚠️ 关键提示:CFG 必须设为 1.0!

这是一个经过蒸馏的模型,专为 CFG 1.0 优化。更高的 CFG 值将导致更差的效果!

✅ CFG 1.0 = 正确
❌ CFG 3.5+ = 错误,效果会变差

其他说明

  • 4-6 步为最佳——模型经过步数蒸馏以实现快速推理
  • 无需负面提示——可用但非必需
  • 自然语言提示——直接描述你想要的画面即可

📥 安装(ComfyUI)

快速入门

  1. 下载你选择的版本(FP8/FP16/BF16)
  2. 放置ComfyUI/models/checkpoints/
  3. 加载使用“Load Checkpoint”节点
  4. 生成!

文件夹结构

ComfyUI/
└── models/
    └── checkpoints/
        └── flux-2-klein-4b-bf16-aio.safetensors  (或 fp16/fp8)

🎨 示例提示词

照片级真实感

一张专业照片,展示一位咖啡师在温馨的咖啡馆制作拿铁拉花,晨光透过窗户洒入,浅景深,使用索尼 A7III 拍摄

数字艺术

一条威严的巨龙盘踞在水晶山峰之巅,背景为极光,奇幻数字绘画,高度精细的鳞片,戏剧性光影

产品摄影

一款奢华香水瓶置于白色大理石上的极简产品摄影,影棚灯光,反射效果,商业摄影风格

💻 能力范围

✅ FLUX.2 [klein] 4B 可实现:

  • 文本到图像(T2I)——从文本生成高质量图像
  • 图像到图像(I2I)——单参考图像编辑
  • 多参考生成——通过多个输入图像实现可控变换
  • 文本渲染——图像中文字渲染效果提升
  • 照片级真实感——专业级照片质量
  • 艺术风格——多样化的艺术风格表现

⚠️ 局限性:

  • 优化用于 1024×1024 分辨率(其他分辨率可用但非最优)
  • 4B 模型——在复杂场景中细节略少于更大模型
  • 蒸馏版本——输出多样性低于基础模型

🔧 技术细节

  • 参数量:40 亿
  • 架构:校正流变换器(Rectified Flow Transformer)
  • 文本编码器:基于 Qwen3
  • 推理步数:4-6(步数蒸馏)
  • 原生分辨率:1024×1024
  • 精度:BF16 / FP16 / FP8
  • 许可证:Apache 2.0

🆚 对比:4B 与 9B

FLUX.2 [klein] 4B

  • 参数量:4B
  • 显存:约 8-13 GB
  • 显卡:RTX 3090/4070+
  • 画质:非常好
  • 许可证:Apache 2.0 ✅
  • 商业用途:支持!

FLUX.2 [klein] 9B

  • 参数量:9B
  • 显存:约 29 GB
  • 显卡:RTX 4090+
  • 画质:优秀
  • 许可证:非商业 ❌
  • 商业用途:不支持

→ 4B 版本适合:消费级硬件、商业项目、快速迭代


❓ 常见问题

Q:我需要单独下载 VAE/文本编码器文件吗?

不需要!AIO = 全功能整合,所有内容均包含在单个文件中。

Q:我能用于商业项目吗?

可以!4B 版本采用 Apache 2.0 许可证。

Q:为什么只用 4-6 步?

该模型经过步数蒸馏,增加步数不会提升画质。

Q:为什么 CFG 必须设为 1.0?

这是专为 CFG 1.0 优化的蒸馏模型,更高的值会降低输出质量。

Q:FP8 和 BF16 有什么区别?

FP8 更小更快,BF16 画质略优。对大多数应用而言,FP8 已足够。

Q:是否支持 LoRA?

支持!特别是基础版本(非蒸馏)非常适合 LoRA 训练。

Q:与 9B 版本有何不同?

9B 画质更好,但仅限非商业用途;4B 是 Apache 2.0 开源许可!


🐛 排障指南

图像“褪色”或过度饱和

  • 检查 CFG —— 蒸馏模型必须设为 1.0!
  • 使用 4-6 步

文本渲染效果差

  • 在提示词中更具体
  • 使用简单、简短的文本
  • 将文本要求置于提示词开头

颜色异常

  • 尝试使用 BF16 版本而非 FP8
  • 确保显示器已正确校准

🙏 致谢

原始模型:Black Forest Labs
架构:校正流变换器
文本编码器:Qwen3
AIO 整合版:SeeSee21

官方链接:


📋 更新日志

v1.0(2026 年 1 月)

  • 首次发布
  • 提供 BF16、FP16 和 FP8 版本
  • 全功能整合:含 VAE + 文本编码器 + UNet

许可证:Apache 2.0 —— 个人与商业用途均免费!🎉


ComfyUI 上最快的开源图像生成模型!

立即下载,开始创作! 🚀

此模型生成的图像

未找到图像。