Cambodia Angkor Bas Relief

세부 정보

모델 설명

이 LoRA 모델은 캄보디아 아앙코르 유적공원 내 아앙코르 톰 복합체 중심부에 위치한 바욘 사원 외벽의 정교한 난각 조각을 제가 촬영한 사진들과, 태국 국경 근처 원격지에 위치하여 아직 복원되지 않은 반테이 체마르 사원(크기면에서 유명한 아앙코르 왓과 견줄 만함)에 아직 남아 있는 조각들에 기반하여 학습되었습니다. 두 사원은 거리가 상당히 떨어져 있지만, 한 패널에는 바욘에서 반테이 체마르로 이어지는 왕실 행렬이 그려져 있어, 두 사원은 서로 관련이 있습니다.

이 모델은 전형적인 이미지 입력(명확한 주체와 배경을 가진 쉽게 태그 가능한 이미지)과 달리, 아앙코르 난각 조각이 복잡하고 여러 주체 및 구성 관점을 포함하여 태그하기 어려운 비정형 이미지 입력에 대해 디퓨전 모델이 얼마나 잘 작동하는지 평가하는 연구 실험입니다. 또한 디퓨전 모델이 고고학 복원 작업에 어떻게 활용될 수 있을지 탐색합니다.

저는 반테이 체마르를 방문할 때 영감을 받았습니다. 이곳은 원격지에 위치해 복원 작업이 대부분 지역 주민들에 의해 이루어졌습니다. 자금 부족 뿐만 아니라, 난각 조각 일부가 없어진 경우(대부분 약탈된 것으로 추정됨) 복원 작업이 중단되었습니다. 현재의 방법은 외국 박물관이 소장한 조각이나 난각 조각이 아직 완전한 상태일 때의 역사적 사진을 요청하는 것입니다. 그러나 이는 비용과 시간이 많이 들며, 국경을 넘어 협력이 필요하여 지역 주민들에게는 어려운 일입니다. 저는 기존 난각 조각에 학습된 디퓨전 모델(예: 인페인팅 및 기타 기법)을 활용하여 원래 있었을 가능성이 있는 조각들을 복원하는 것이 고고학 복원 작업에 유용한 도구가 될 수 있을 것이라고 생각합니다.

LoRA 가중치

높은 가중치는 아앙코르 난각 조각의 "등록" 기반 시점으로 구성 방향을 이동시키고, 대조적인 3D 난각을 평면적인 난각으로 "평탄화"합니다.

난각 조각의 대부분이 인물을 묘사하기 때문에, 높은 가중치는 이미지 내 인물을 더 많이 도입합니다. 이는 그룹 프롬프트(예: "마을 주민들")의 구성이 가중치가 높을수록 더 복잡해지는 흥미로운 효과를 만듭니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.