Step1X Edit GPT4o Style Image Editing

세부 정보

파일 다운로드

모델 설명

Step1X Edit GPT4o 스타일 이미지 편집

https://www.runninghub.ai/post/1916456042962817026

우리는 최첨단 이미지 편집 모델 Step1X Edit를 출시했으며, 이 모델의 성능은 GPT 4o 및 Gemini2 Flash와 같은 폐쇄형 모델과 경쟁합니다. 구체적으로, 우리는 다중 모달 LLM을 활용해 참조 이미지와 사용자 편집 지시를 처리합니다. 이를 통해 잠재 임베딩을 추출하고, 확산 이미지 디코더와 통합하여 대상 이미지를 생성합니다. 모델을 학습시키기 위해 고품질 데이터셋을 생성하는 데이터 생성 파이프라인을 구축했습니다. 평가를 위해, 실제 사용자 지시를 기반으로 한 새로운 벤치마크 GEdit Bench를 개발했습니다. GEdit Bench에서의 실험 결과는 Step1X Edit가 기존 오픈소스 베이스라인을 크게 능가하며 선두 주자인 전유 모델의 성능에 근접함을 보여주며, 이미지 편집 분야에 중요한 기여를 합니다. 자세한 내용은 기술 보고서를 참조하세요.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.