Step1X Edit GPT4o Style Image Editing
詳細
ファイルをダウンロード
モデル説明
Step1X Edit GPT4oスタイルの画像編集
https://www.runninghub.ai/post/1916456042962817026
我々は、最先端の画像編集モデル「Step1X Edit」をリリースしました。このモデルの性能は、GPT-4oやGemini2 Flashなどのクローズドソースモデルに匹敵します。具体的には、マルチモーダルLLMを用いて参照画像とユーザーの編集指示を処理し、潜在的埋め込みを抽出して、扩散画像デコーダと統合することで目標画像を生成します。モデルの訓練には、高品質なデータセットを生成するためのデータ生成パイプラインを構築しました。評価には、実際のユーザー指示に基づいた新規ベンチマーク「GEdit Bench」を開発しました。GEdit Benchでの実験結果により、Step1X Editは既存のオープンソースベースラインを大幅に上回り、最先端のプロプライエタリモデルに近い性能を達成しました。これは画像編集分野への重要な貢献です。詳細については、当社の技術レポートをご参照ください。

