휴대폰에 인공지능(AI) 기능이 처음 적용된 것은 수년 전이지만, 2024년에는 생성 AI가 탑재되고 온디바이스 AI가 강화되며 본격적인 AI 휴대폰 마케팅의 시대를 열었다. 휴대폰 제조사들은 AI 폰에 다양한 기능을 탑재하면서 사용자의 호응을 기대하지만, 사용자들이 가장 많이 관심을 갖는 기능은 카메라 사진 보정과 실시간 통역 및 번역 기능인 듯하다. 특히 삼성전자는 지난해 갤럭시 S24를 공개하며 실시간 번역과 함께 대면 대화는 물론, 통화 중 실시간 양방향 통역 기능을 선보이며 큰 관심을 받았다.
외국어를 자동 번역해 주는 기능에 대한 요구나 관심은 AI가 연구되기 이전부터 있었고, 이런 관심은 암호학의 발전과 에스페란토(Esperanto)어와 같은 국제 통용어에의 개발에 영향을 줬다. 그러나 본격적인 기계에 의한 자동 번역(MT, Machine Translation)을 꿈꾸게 된 것은 컴퓨터가 개발된 뒤의 일이다. 컴퓨터의 초기 시절에는 컴퓨터의 메모리 용량이 충분하다면 그 안에 모든 영어 단어와 번역할 대상 외국어 단어를 넣어두고, 서로 잘 연관 지어 단어 간 일대일 변환을 해낸다면 자동 번역을 수행할 수 있을 것이라고 기대했다. 가능성이 전혀 없지는 않았지만, 평범한 사람의 생각에도 그런 방식에서는 번역의 정확도를 기대하기 쉽지는 않음을 알 수 있다.
본격적인 기계번역에 대한 연구가 시작된 것은 록펠러 재단에서 자연 과학 부문을 맡고 있던 워렌 위버(Warren Weaver)가 1949년에 발표한 ‘번역(Translation)’이란 메모를 계기로 볼 수 있다. 워렌 위버는 클로드 섀넌과 함께 ‘통신의 수학적 이론’을 같이 쓴 공저자이며, 그래서 매카시가 다트머스 회의를 위해 록펠러 재단의 지원을 받기 위해 처음 도움을 구했던 사람이다.
위버는 그의 메모에서 그동안 기대됐던 단어 대 단어 변환의 접근 방식은 중대한 한계점이 존재한다고 주장했다. 그래서 근접한 문장의 맥락을 고려해 의미를 파악하고, 원어에서 일련의 전제조건을 설정하고 컴퓨터로 자동 추론해서 번역 결과의 결론을 제시하는 방식을 추구해야 한다고 했다. 또 2차 세계대전 기간에 크게 발전한 암호학 기술을 번역에 적용하는 방안을 제시하기도 했다. 모든 언어에는 번역을 단순 명료하게 해줄 수 있는 언어적 공통성이 있으므로 이를 이용해야 한다고도 제안했다. 이런 위버의 메모는 많은 사람들에게 영향을 주었고, 이를 계기로 워싱턴 대학, UCLA, MIT 등 여러 기관에서 기계 번역에 대한 연구가 활발해졌는데, 그래서 위버는 현재까지 기계 번역의 선구자로 불린다.
MIT는 기계번역 부문의 첫 전임 연구원으로 여호수아 바힐렐(Yehoshua Bar-Hillel)을 1951년에 임명했는데, 그는 이듬해에 기계번역에 관한 첫번째 컨퍼런스를 조직했다. 컨퍼런스에서 기계번역을 위한 많은 제안과 주장들이 제기됐는데, 상당수 참가자들은 무엇보다 기계번역의 실현 가능성을 입증하는 것이 중요하다는 데 의견을 모았다.
그 컨퍼런스에 참석했던 조지타운대학교의 언어학자 리옹 도스테어(Léon Dostert)는 IBM과 협력관계를 구축해서 기계번역을 공개 시연하는 프로젝트를 진행했다. 1954년 1월에 시연된 최초의 기계번역 시연은 러시아어를 번역하는 시스템이었는데, IBM 701 컴퓨터에서 구동되고, 49개의 러시아어 샘플 문장을 250개의 제한된 어휘와 6개의 문법 규칙을 갖고 영어로 번역했다. 이 시연은 과학적 관점에서의 가치는 거의 없었지만, 미국에서 기계번역에 대한 대규모 연구 자금을 유인하고, 다른 나라 특히 소련에서 기계번역 프로젝트의 시작을 자극하는 데는 충분히 인상적이었다.
당시는 2차 세계 대전 이후 동서 냉전 시대였기에, 기계 번역은 군사적 목적에 유용할 것으로 보였다. 그래서 당시의 기계번역은 유기 화학, 법률, 군사 문제 등으로 주제가 한정되기는 했지만, 그래도 그동안 주로 숫자 처리 및 계산 위주로 활용된 컴퓨터가 언어학 분석에도 활용될 수 있음이 입증된 사례였다. 그렇게 1950년대 후반부터 1960년대 중반까지 러시아와 프랑스, 캐나다 등에서도 기계번역에 대한 연구가 활발해지고, 주제에 제한이 있기는 했지만 성과물들이 발표됐다.
첫번째 시연을 나름 성공한 이후 도스테어는 “3~5년 내에 광범위한 기계 번역이 이루어질 것”이라고 예측했고, 미국 중앙정보국(CIA)과 미 공군 및 해군연구소의 자금 지원을 받아 1964년까지 ‘GAT(Georgetown Automatic Translation)’라는 이름의 기계 번역 시스템을 개발하게 됐다. GAT는 러시아어의 물리 관련 문서를 영어로 번역하는 것을 목표로 했는데, 단어 대 단어 번역 접근 방식으로 번역의 질은 많이 떨어졌지만 문서를 빠르게 대충 살펴보는 정도는 가능했다. 사실 당시에는 다른 대체 수단이 없기도 했다.
1950년대의 낙관론에 기반한 자금 지원으로 기계번역 연구는 더욱 활발해졌지만, 도스테어의 예측과 달리 기술적 진전은 잘 이뤄지지 않았다. 연구가 진행될수록 오히려 언어 문제의 복잡성이 점점 더 분명해지며 실망은 더 커지는 것 같았다. 이런 상황에 기계번역 컨퍼런스를 조직할 정도로 기계번역을 지지했던 바힐렐은 입장이 바뀌어, 당시 목표이던 ‘고급스러운 완전 자동 번역’은 가까운 미래뿐만 아니라 영원히 불가능할 수도 있다는 확신을 갖게 됐다.
그는 필기구와 가축의 우리라는 뜻을 모두 갖고 있는 ‘Pen’이 포함된 문장 ‘The box is in the pen’를 예로 들었다. 상자와 펜의 크기에 관한 상식을 갖지 못하는 한, 이런 문장을 제대로 번역할 수 없다고 주장했다. 이런 내용으로 1960년에 발표한 보고서는 AI 연구자들 사이에 널리 읽혀 졌다. 바힐렐은 그의 보고서에서 고급스러운 번역을 위해서는 단어만이 아닌 세상의 많은 지식들이 같이 고려돼야 가능한데, 컴퓨터에 그런 백과사전적 지식을 모두 갖게 하는 것은 비현실적이며 컴퓨터가 그런 모든 지식을 처리할 수 없다고 주장했다.
그의 이런 주장은 낙관론을 갖고 있던 AI 연구자들의 강력한 반발을 낳았고, 그래서 바힐렐은 와이젠바움의 경우와 같이, AI를 연구했지만 비관론자로 돌아선 변절자로 취급 받기도 했다.
바힐렐의 주장의 옳고 그름을 떠나, 기계번역의 연구가 상당한 예산의 지출에도 불구하고 눈에 띌 만한 진전이 없었던 것은 사실이었다. 그래서 미 국방부, CIA, 국립과학 재단과 같은 정부 후원자들은 기계번역의 전망을 검토하기로 했다. 정부 후원 조직의 요청으로 미국 국립과학아카데미는 'ALPAC(Automatic Language Processing Advisory Committee, 자동 언어 처리 자문위원회)'을 구성하고, 기계 번역 분야의 연구와 개발 상황에 대한 조사를 시작했다.
1965년 8월에 발표된 보고서는 “유용한 기계 번역에 대한 즉각적이거나 예측 가능한 전망은 없다”라고 결론지으며, 자동 번역에 대한 더 이상의 지원을 중단할 것을 권고했다. 또 기계번역 연구에 대한 투자는 자동사전과 같은 번역기를 위한 보조 도구의 개발이나 컴퓨터 언어학 기초 연구의 지원으로 전환하기를 권장했다.
ALPAC 보고서는 번역 과정에 대한 이해가 충분하지 않고 또 근시안적이며 편향됐다는 비판이 많이 제기됐지만, 큰 흐름을 돌이킬 수는 없었다. 이 보고서로 인해 기계 번역에 지원되던 대규모 자금은 극적으로 삭감되거나 중단됐다. 이 사건으로 기계번역 연구가 완전히 사라진 것은 아니지만, 기계번역은 실패한 프로젝트로 인식됐고, 커다란 시련을 맞게 됐다.
결과적으로 10년 이상 이 분야의 연구는 거의 중단되다시피 했고, 그 기간은 ‘조용한 10년(Quiet Decade)’이라고 불린다.
문병성 싸이텍 이사 moonux@gmail.com
