FLUX.1-Kontext-dev
详情
下载文件
关于此版本
模型描述
[
](https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev/blob/main/teaser.png)
FLUX.1 Kontext [dev] 是一个拥有120亿参数的校正流变换模型,能够根据文本指令编辑图像。如需了解更多信息,请阅读我们的博客文章和技术报告。有关[pro]版本的信息,请参见此处。
主要功能
根据编辑指令修改现有图像。
无需微调即可实现角色、风格和物体参考。
强大的一致性允许用户通过多次连续编辑精细调整图像,且视觉漂移极小。
采用指导蒸馏训练,使
FLUX.1 Kontext [dev]更高效。开放权重,推动新的科学研究,并赋能艺术家开发创新工作流。
生成的输出可用于个人、科学和商业用途,具体请参阅FLUX.1 [dev] 非商业许可证。
使用方法
我们提供了一个专用的GitHub 仓库,其中包含 FLUX.1 Kontext [dev] 的参考实现和采样代码。希望基于 FLUX.1 Kontext [dev] 进行开发的开发者和创作者可将其作为起点。
FLUX.1 Kontext [dev] 也已在 ComfyUI 和 Diffusers 中提供。
API 接口
FLUX.1 Kontext 模型还可通过以下来源的 API 获取:
DataCrunch: https://datacrunch.io/flux-kontext
Replicate: https://replicate.com/blog/flux-kontext
TogetherAI: https://www.together.ai/models/flux-1-kontext-dev
与 diffusers 🧨 一起使用
# 在未来稳定版本发布前,从主分支安装 diffusers
pip install git+https://github.com/huggingface/diffusers.git
图像编辑:
import torch
from diffusers import FluxKontextPipeline
from diffusers.utils import load_image
pipe = FluxKontextPipeline.from_pretrained("black-forest-labs/FLUX.1-Kontext-dev", torch_dtype=torch.bfloat16)
pipe.to("cuda")
input_image = load_image("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/diffusers/cat.png")
image = pipe(
image=input_image,
prompt="Add a hat to the cat",
guidance_scale=2.5
).images[0]
Flux Kontext 内置完整性检查器,应在图像生成后运行。要启用安全检查器,请从black-forest-labs/flux 官方仓库安装,并添加以下代码:
import torch
import numpy as np
from flux.content_filters import PixtralContentFilter
integrity_checker = PixtralContentFilter(torch.device("cuda"))
image_ = np.array(image) / 255.0
image_ = 2 * image_ - 1
image_ = torch.from_numpy(image_).to("cuda", dtype=torch.float32).unsqueeze(0).permute(0, 3, 1, 2)
if integrity_checker.test_image(image_):
raise ValueError("Your image has been flagged. Choose another prompt/image or try again.")
有关节省显存和提速的措施,请参阅 diffusers 文档
风险
Black Forest Labs 致力于负责任地开发生成式 AI 技术。在发布 FLUX.1 Kontext 之前,我们评估并缓解了模型与服务中的一系列风险,包括非法内容生成。我们实施了一系列发布前缓解措施,以防止第三方滥用,并在发布后继续采取额外措施应对残留风险:
预训练缓解。我们对预训练数据中的多种“不适合工作场所”(NSFW)内容进行了过滤,以防止用户通过文本提示或上传图像生成非法内容。
后训练缓解。我们与致力于防止网络滥用的独立非营利组织“互联网观察基金会”合作,从后训练数据中过滤已知的儿童性虐待材料(CSAM)。随后,我们进行了多轮针对性微调,以进一步防止潜在滥用。这些技术通过抑制模型中的某些行为和概念,帮助防止用户通过文本提示生成合成的 CSAM 或非自愿亲密图像(NCII),或将上传图像转化为合成的 CSAM 或 NCII。
发布前评估。在整个过程中,我们对多个模型检查点进行了多次内部和第三方评估,以识别进一步改进空间。第三方评估包含21个 FLUX.1 Kontext [pro] 和 [dev] 检查点,重点通过仅文本提示和带文本提示的上传图像进行对抗性测试,以诱导 CSAM 和 NCII。随后,我们对拟发布的检查点进行了最终的第三方评估,重点评估文本到图像和图像到图像的 CSAM 和 NCII 生成能力。最终的 FLUX.1 Kontext [pro](仅通过 FLUX API 提供)和 FLUX.1 Kontext [dev](作为开源权重发布)检查点均展现出对违规输入极高的抗性,其中 FLUX.1 Kontext [dev] 在这些风险类别中的抗性优于其他类似开源模型。基于这些发现,我们批准通过 API 发布 FLUX.1 Kontext [pro] 模型,并在非商业许可下发布 FLUX.1 Kontext [dev] 模型的开源权重,以支持第三方研究与开发。
推理过滤器。我们在 FLUX API 上为 FLUX.1 Kontext [pro] 应用了多重过滤器,拦截文本提示、上传图像和输出图像。CSAM 和 NCII 过滤器由第三方提供商 Hive 提供,开发者无法调整或移除。我们还提供其他潜在有害内容(如血腥暴力)的过滤器,开发者可根据自身风险状况调整。此外,开源 FLUX.1 Kontext [dev] 模型的仓库中包含非法或侵权内容过滤器。根据 FLUX.1 [dev] 非商业许可证条款,使用该模型时必须启用过滤器或进行人工审核。我们可能会随机抽查已部署 FLUX.1 Kontext [dev] 模型的用户,以确认其是否已部署过滤器或人工审核流程。
内容溯源。FLUX API 会为输出内容添加加密签名的元数据,以表明图像由我们的模型生成。我们的 API 实现了内容溯源与真实性联盟(C2PA)的元数据标准。
政策。访问我们的 API 及使用我们的模型受我们的开发者服务条款、使用政策和 FLUX.1 [dev] 非商业许可证约束,禁止生成非法内容或将生成内容用于非法、诽谤或滥用目的。开发者和用户必须同意这些条款,方可访问 FLUX Kontext 模型。
监控。我们持续监控发布后的违规使用模式,对通过 FLUX API 故意且反复违反政策的开发者,将予以封禁。此外,我们提供专用邮箱([email protected])以收集社区反馈。我们与互联网观察基金会和全国失踪与受虐儿童中心等组织保持报告关系,并欢迎与监管机构、开发者和研究人员持续合作,共享新兴风险情报并开发有效的缓解措施。
许可证
本模型遵循FLUX.1 [dev] 非商业许可证。
引用
@misc{labs2025flux1kontextflowmatching,
title={FLUX.1 Kontext: Flow Matching for In-Context Image Generation and Editing in Latent Space}, Add commentMore actions
author={Black Forest Labs and Stephen Batifol and Andreas Blattmann and Frederic Boesel and Saksham Consul and Cyril Diagne and Tim Dockhorn and Jack English and Zion English and Patrick Esser and Sumith Kulal and Kyle Lacey and Yam Levi and Cheng Li and Dominik Lorenz and Jonas Müller and Dustin Podell and Robin Rombach and Harry Saini and Axel Sauer and Luke Smith},
year={2025},
eprint={2506.15742},
archivePrefix={arXiv},
primaryClass={cs.GR},
url={https://arxiv.org/abs/2506.15742},
}





