우리는 사전 학습된 텍스트-이미지 확산 모델에 이미지 프롬프트 기능을 부여하기 위한 효과적이고 경량의 어댑터인 IP-Adapter를 제안한다. 단 22M 개의 파라미터만을 가진 IP-Adapter는 미세 조정된 이미지 프롬프트 모델과 동등하거나 더 나은 성능을 달성할 수 있다. IP-Adapter는 동일한 기본 모델에서 미세 조정된 다른 사용자 정의 모델뿐 아니라 기존의 제어 도구를 사용한 제어된 생성에도 일반화될 수 있다. 또한, 이미지 프롬프트는 텍스트 프롬프트와 함께 작동하여 멀티모달 이미지 생성을 효과적으로 수행할 수 있다.