구글 알파벳(Alphabet)의 자회사인 딥마인드(DeepMind)가 고대 그리스 비문의 누락된 텍스트를 복원하고 원래 기록된 위치를 식별하며 기록된 시기를 확인하는 데 도움을 줄 수 있는 최초의 심층 신경망인 이타카(Ithaca)를 공개했다.
네이처(Nature) 저널에 발표된 논문에 따르면 이타카는 손상된 텍스트를 복원하는 데 62%, 비문의 지리적 기원을 고대 세계의 84개 지역 중 하나로 지정하는데 71%의 정확도를 보이며 텍스트의 연대를 알려진 기록 연도로부터 평균 30년 이내로 추정할 수 있다.
고대 비문들은 수세기에 걸쳐 손상되었거나 원래 위치에서 옮겨지기 때문에 비문을 해석하기 어렵고 시간이 많이 걸린다. 또한 돌, 도기나 금속 등의 무기물에 새겨지는 경우가 많기 때문에 방사성 탄소 연대 측정과 같은 현대적 연대 측정 기술도 사용할 수 없다.
이러한 문제를 해결하기 위해 역사가들은 유사한 비문에서 텍스트와 맥락의 유사점을 찾는다. 이것은 항상 길고 지루한 과정이다. 딥마인드는 패커드 휴머니티 연구소(Packard Humanities Institute)가 제공하는 178,000개 이상의 그리스어 비문 데이터 세트에서 기본 패턴을 발견하기 위해 이타카를 훈련시켰다. 각 비문에는 기록된 위치와 시기를 설명하는 메타데이터 레이블이 지정돼 있다. 모든 기계 학습 시스템과 마찬가지로 이타카는 이 정보에서 패턴을 찾고 복잡한 수학적 모델로 이 정보를 인코딩해서 텍스트, 위치 및 시기를 추론한다.
딥마인드는 이타카가 고대 비문에서 누락된 텍스트를 복원하는 역사가의 정확도를 25%에서 72%로 개선하는 데 도움이 됐다고 강조했다. 이타카는 기원전 446-445년 이전에 작성된 것으로 알려진 아테네 법령(예: 시민권 수여, 전쟁 선포, 조약 제정)이 소크라테스와 페리클레스와 같은 인물들이 살았을 기원전 421년에 작성된 것이라고 추론하기도 했다.
또한 딥마인드는 이타카의 추론이 잘못 해석될 가능성을 최소화하기 위한 시각 보조 장치를 사용자에게 제공한다. 실제로 이타카는 손상된 텍스트를 복원하는 데 38%의 확률로 오류를 범했다. 이타카는 사용자가 선택할 수 있는 여러 텍스트 복원 ‘가설’을 제공하며 각각은 서로 다른 관련 신뢰도 메트릭을 사용한다. 시스템은 불확실성 수준을 나타내는 84개의 고대 지역에 대한 확률을 각각 보여 준다. 이타카는 또한 기원전 800년부터 기원후 800년까지를 시기별로 나눠 고대 비문이 생성됐을 확률의 분포를 생성한다.
딥마인드는 이타카의 진정한 가치는 유연성에 있다고 강조한다. 고대 그리스 비문을 학습했지만 다른 고대 스크립트에도 작동하도록 쉽게 구성할 수 있다. 이타카는 라틴어뿐만 아니라 설형 문자인 마야어를 포함한 모든 고대 언어에 실제로 적용 가능하다.. 파피루스, 필사본 등 모든 서면 매체가 가능하다
벤처비트(VentureBeat)에 따르면 워릭(Warwick) 대학교 교수인 앨리슨 쿨리(Alison Cooley)는 “이타카와 같은 시스템이 인간의 전문 지식의 필요성을 대체할 것이라고 믿지 않는다. 대신 고대 유물을 연구하는 연구원을 위한 가이드 또는 도구 역할을 할 수 있으며 그렇지 않으면 놓쳤을 패턴을 찾는 데 도움이 될 수 있다”고 말했다. 이어 "이타카는 세기에 걸쳐 고대 세계에서 그리스어로 쓰여진 비문의 복원, 연대 측정을 향상시키기 위해 AI를 사용하는 데 있어 매우 중요한 발전을 보여준다"고 덧붙였다.
AI타임스 박찬 위원 cpark@aitimes.com
