Step1X Edit GPT4o Style Image Editing
详情
下载文件
模型描述
Step1X Edit GPT4o 风格图像编辑
https://www.runninghub.ai/post/1916456042962817026
我们发布了最先进的图像编辑模型 Step1X Edit,其性能可与 GPT-4o 和 Gemini2 Flash 等闭源模型相媲美。具体而言,我们利用多模态大语言模型处理参考图像和用户编辑指令,提取潜在嵌入,并将其与扩散图像解码器结合以生成目标图像。为训练该模型,我们构建了数据生成管道以创建高质量数据集。在评估方面,我们开发了 GEdit Bench,这是一个基于真实用户指令的全新基准。在 GEdit Bench 上的实验结果表明,Step1X Edit 显著优于现有开源基线模型,并接近领先专有模型的性能,为图像编辑领域做出了重要贡献。更多细节请参阅我们的技术报告。

