Flux.2
详情
下载文件
模型描述
FLUX.2
FLUX 2.0 终于到来
FLUX.2 专为真实创意生产而打造,而不仅限于吸引眼球的演示。它能生成高质量视觉效果,在多个参考图像中保持角色与风格的一致性,精准遵循结构化提示,处理复杂文本,遵守品牌规范,并可靠地管理光影、布局和标志。它还能在高达400万像素的分辨率下进行图像编辑,同时保持清晰度与连贯性。

黑森林实验室:开放核心
BFL团队相信,视觉智能应由全球的研究人员、创作者和开发者共同协作开发,而非集中于少数人手中。因此,他们将尖端性能与开放研究和开放创新相结合。除了提供可扩展、可定制的生产端点外,我们还向社区发布强大、透明且模块化的开源权重模型。
当团队于2024年创立黑森林实验室时,其使命是让开放创新可持续发展,并基于他们此前推出全球最广泛使用开源模型的历史。团队将开源系统如FLUX.1 [dev]——如今已成为全球最受欢迎的开源图像模型——与专业级变体如FLUX.1 Kontext [pro]相结合,后者已被Adobe到Meta等团队广泛使用。这种开放核心理念推动了实验、鼓励了审查、降低了成本,并允许开发者持续将来自黑森林和硅谷的开源技术分享给全世界。
从FLUX.1到FLUX.2
FLUX.1展示了强大媒体模型作为创意工具的潜力——实现精准、高效、可控与真实感;而FLUX.2则展现了前沿能力如何重塑完整的生产流程。通过显著提升生成的经济效益,FLUX.2有望成为现代创意工作流的基础组件。

新增功能
多参考图像生成
- 可同时使用多达10张参考图像,实现行业领先的字符、产品和视觉风格一致性。
增强细节与写实效果
- 更清晰的纹理、更精确的细节和稳定真实的光影效果,使其成为产品图像、可视化和摄影级输出的理想选择。
高级文本渲染
- 字体排版、信息图表、表情包和UI原型现在能生成清晰可读的精细文本,满足生产级使用需求。
更强的提示遵循能力
- 模型能更准确地遵循复杂、多部分的提示和构图规则。
扩展的现实世界知识
- 对现实世界环境、光影、物理规律和空间关系的更深理解,使生成场景的行为和外观更符合预期。
更高分辨率与更灵活的输入/输出
支持高达400万像素的图像编辑,提供更自由的宽高比和输入/输出格式选择。
编辑:
FLUX.2 [dev]
一种基于FLUX.2核心架构的320亿参数开源权重模型,是当前最强大的开源图像生成与编辑模型,支持文本到图像和多图像编辑,仅需单个检查点即可完成。权重已在Hugging Face发布,可使用我们的参考推理代码在本地运行。借助消费级GPU(如GeForce RTX系列),您可运行由NVIDIA和ComfyUI优化的fp8实现。
您还可以通过FAL、Replicate、Runware、Verda、TogetherAI、Cloudflare和DeepInfra的API端点体验FLUX.2 [dev]。
如需商业授权,请访问我们的网站。
来源:https://flux2.io/flux-2-0-is-finally-here/
FLUX.2 – VAE
一种全新设计的变分自编码器,在可学习性、压缩效率与输出质量之间实现平衡,为所有FLUX.2流骨干提供底层支持。详细技术文档已发布,FLUX.2 VAE已根据Apache 2.0许可证在Hugging Face上开源。
