2016년 3월에는 프로 바둑 기사 이세돌과 AI 프로그램 알파고(AlphaGo)의 대국이 벌어졌다. 알파고가 4승 1패로 승리하며, 바둑계는 물론 과학 산업계에도 큰 충격을 안겨줬다. 10년 전, IBM의 딥블루(Deep Blue)가 인간 체스 챔피언 가리 카스파로프를 이겼을 때도 기계가 인간의 지능을 따라잡는 증거라며 화제였으나, 알파고의 승리는 그보다 더 큰 충격이었다.
탐색공간 크기의 차이도 있지만, 딥블루는 강력해진 컴퓨터의 계산력으로 탐색을 빠르게 실행한 시스템이다. 반면, 알파고는 컴퓨터가 스스로 학습한 패턴을 기반으로 추론을 통해 실행한 시스템이었기 때문이었다. 딥블루가 엄청난 연산력의 컴퓨팅 수준으로 놀라움을 안겨줬다면, 알파고는 기계가 생각할 수도 있다는 실질적인 두려움과 경외감을 안겨줬다.
딥러닝과 강화 학습(RL) 기반의 알파고는 인간의 명시적인 지도 없이 스스로 전략을 학습했기 때문에, AI의 창의적 사고 가능성을 시사하며 AI의 발전 방향에 대한 철학적 논쟁을 촉발하기도 했다. 특히 이전까지 조심스럽게 논의되거나, 공상의 영역으로 치부되던 인공일반지능(AGI)의 실현 가능성을 공론의 장으로 끌어내고, 세계적인 관심과 주목을 받게 해줬다.
그것은 대국 중의 인터뷰를 통해 알파고 관계자들이 AGI를 여러 차례 언급했기 때문이었다. 딥마인드의 CEO 허사비스는 알파고의 기술로 게임 같은 한정된 분야가 아닌 여러 분야에서 지능을 발휘할 수 있는 AGI 구현이 가능하며, 삶에 직접적인 영향을 미치는 분야의 적용을 계획하고 있다고 말했다. 또 구글의 CEO 에릭 슈미트도 알파고가 AGI 시대를 앞당길 것이라고 주장했다. 사실, 딥마인드는 AGI 개발을 목표로 설립된 회사였다.
딥마인드를 견제하겠다며 설립된 오픈AI도 2015년 설립 당시에는 공식적으로 AGI를 언급하는 것에 조심스러워하며 ‘디지털 지능’이라는 표현을 사용했다. 2018년이 돼서야 오픈AI는 회사의 새 헌장을 발표하면서 ‘경제적으로 가치 있는 업무 영역에서 인간을 능가하는 고도로 자율화된 시스템’을 AGI라고 하며, 공식적으로 AGI의 개발을 밝혔다. 그런데, 딥마인드는 창업자들이 AGI 개발을 목표로 설립한 회사였기 때문에, 2010년의 사업계획서에 이미 AGI의 개발을 천명했다.
한편, 알파고의 시합 2년 전인 2014년 1월, 영국의 과학 기술계에서는 전례 없던 한 기업의 인수 건으로 떠들썩했다. 실리콘 밸리의 IT 공룡 구글이 직원 25명도 되지 않는 영국의 작은 스타트업을 6억5000만달러라는 천문학적 금액을 들여 인수한다는 보도가 나왔기 때문이었다.
더군다나 AI 기업이라고만 간략히 알려진 이 스타트업은 업계에서도 크게 알려진 회사가 아니었고, 제품도, 사업 계획도 외부 사람들에게 거의 알려진 내용이 없었다. 이미 페이스북이 인수에 의향을 보였고, 테슬라의 일론 머스크도 인수 의지를 내비쳤던 그 스타트업이 2년 뒤 이세돌과 대국을 벌인 알파고의 개발사 딥마인드 테크놀로지스(DeepMind Technologies)였다.
딥마인드를 설립한 데미스 허사비스(Demis Hassabis)는 그리스계 아버지와 중국계 싱가포르인 어머니 사이에서 태어났다. 4살 때 배운 체스를 워낙 잘 둬서 체스 천재 소리를 듣기도 했고, 6살 때에 8세 이하 대회에서 우승하고 9살 때 11세 이하 팀 주장을 맡기도 했다.
영국의 여러 체스 대회에서 우승했으며, 컴퓨터 게임과 카드 게임 등 다양한 보드게임에도 능했다. 8세 때 탄 체스 대회 상금으로 처음 컴퓨터를 구입해 프로그래밍을 익혔는데, 체스 챔피언이 된 13세 이후에는 체스보다 컴퓨터를 더 좋아하게 됐다.
15살 당시에는 크게 인기를 얻던 영국 게임 회사 불프로그(BullFrog)에 입사해 게임 개발을 시작했는데, 17세 때 불프로그 창업자와 공동 개발한 게임은 1000만장 이상 판매됐다. 케임브리지대학교에 진학한 그는 컴퓨터 공학을 전공하며 최우등으로 졸업했다. 졸업 후 직접 게임 회사를 설립해 기술적으로도 뛰어나고 AI가 잘 구현됐다는 평을 받은 게임을 개발했는데, 상업적으로 성공하지 못하면서 회사 문을 닫았다. 20대 중반까지의 체스, 컴퓨터, AI 그리고 게임 분야에서 활동을 보면, 이력만으로도 허사비스는 이미 천재라는 소리를 들을 수 있었다.
뇌에 대해 관심이 커진 그는 게임 업체를 정리한 뒤 런던칼리지대학교(UCL) 박사 과정에 진학해 인지 과학을 전공하며 인간 기억의 메커니즘을 연구했다. 2007년에 발표한 그의 논문은 사이언스지가 선정한 그해의 최고 성과 중 하나로 선정됐다. 박사 과정 중에 미국의 MIT, 하버드대학교 등에서 방문 연구원으로 신경과학과 AI를 계속 연구하던 그는 2009년에 박사 학위를 받았다. 이듬해인 2010년 박사후 과정 동료였던 셰인 레그(Shane Legg)와 동생의 친구였던 무스타파 술레이먼(Mustafa Suleyman)과 머신러닝 과 AI 스타트업 딥마인드를 설립했다.
제프리 힌턴이 설립한 UCL의 개츠비 연구소(Gatsby Unit)에서 박사후 과정을 밟는 동안 허사비스는 레그를 만났다. 레그는 2005년 과거 동료였던 벤 괴르첼의 새로운 책의 제목으로 AGI를 선정해 주며, AGI라는 용어의 대중화에 크게 기여했다. 두뇌 자체가 초지능을 개발할 수 있는 지도라고 확신하며 인간을 뛰어넘는 초지능의 개발을 꿈꿨던 그는 박사학위 논문도 ‘기계 초지능’의 가능성과 한계 그리고 미래에 발생할 수 있는 문제점에 대한 연구였다. 그래서 그는 두뇌와 머신러닝의 연관성을 연구하던 개츠비 연구소에서 박사후 과정을 밟았다. 당시는 개츠비 연구소에서도 AGI를 공식적으로 논의하기 쉽지 않은 시절이었는데, AGI 개발로 지능 문제를 해결하고자 했던 허사비스와 레그는 잘 통했다.
두 사람은 박사후 연구원으로 일하면서 AGI 개발에 대한 논의를 이어갔는데, 기업가 겸 사회활동가인 술레이먼도 자주 만났다. 술레이먼은 허사비스 동생의 절친으로, 이미 10대에 무슬림 청소년 상담 서비스를 공동으로 설립했다. 또 런던 시장의 인권 정책 보좌관으로 일하기도 했고, 사회문제를 해결하는 컨설팅 회사를 설립하기도 했다. AGI를 여러 문제 해결에 활용한다는 생각과 미래에는 거의 모든 문제를 해결할 수 있을 거라는 허사비스와 레그의 비전에, 술레이먼은 그 기술을 사회문제에도 적용할 수 있을 거라는 기대를 했다.
사람의 의식을 AGI에 통합하고 싶어 한 레그와 사회 문제 해결에 AGI를 활용하려는 술레이먼, 우주에 관한 근원적 발견을 AGI로 이루겠다는 허사비스. 이들의 동기는 모두 달랐지만, AGI 개발에 관한 열정은 같았다. 그래서 학계에서의 연구 중심의 AGI 개발에 집중한 레그와 현실 세계의 문제 해결을 위한 AGI 연구에 동조한 슐레이먼, 그리고 인류의 미래 문제를 해결하기 위해 산업계에서의 AGI 개발을 주장한 허사비스는 각자의 독특한 이상을 구현하기 위해 2010년에 딥마인드를 공동으로 설립했다.
딥마인드는 사업계획서에서 공식 목표로 AGI 개발을 천명했고, 또 자신들의 연구가 안고 있는 위험성도 설명하며 기술을 군사적 목적으로는 제공하지 않을 것임을 밝혔다. 그리고 페이팔(Paypal)의 창업자이자 과감한 벤처 투자가였던 피터 틸을 설득해서 딥마인드 설립과 운영에 필요한 자금을 확보할 수 있었다.
“지능이라는 수수께끼를 풀고 이를 이용해 다른 모든 문제를 해결한다”라는 슬로건을 내세운 딥마인드는 모든 일에 효과적이고 유용한 범용 AI를 개발하는 것을 초기 목표로 삼았다. 그리고 첫번째 시도로 1970년 후반에 출시되어 큰 인기를 끌었던 아케이드 게임기였던 ‘아타리 2600(Atari 2600)’의 게임을 수행하는 AI 프로그램을 만들었다.
물론 그 이전까지 게임을 수행하는 AI에 대한 연구가 없었던 것은 아니지만, 딥마인드의 게임 AI에 대한 접근은 좀 달랐다. 신경망 프로그램으로 개발하지만, AI에게는 표시되는 점수를 포함해서 게임 화면과 조이스틱, 버튼 등 조작 가능한 동작만 알려주고, 게임에 대한 지식이나 게임 방법을 전혀 알려주지 않은 무지의 상태에서 시작한다. 스스로 게임을 수행하면서 AI가 게임을 익히도록 하는 것이었다.
이를 가능하게 해준 것은 딥마인드가 2014년 공개한 알고리즘 DQN(Deep Q Network)이었다. RL의 방법으로 1989년에 개발된 Q-러닝을 딥러닝을 활용해 구현한 것이었다.
이전까지는 신경망으로 Q-러닝을 구현하면 학습이 상당히 불안정해진다고 알려졌다. 딥마인드는 무작위 샘플링으로 데이터의 상관성을 제거하고, 기본 학습을 하는 주 신경망 외에 그 학습이 좋은 선택인지 비교하는 목표 신경망을 추가하는 방법으로 문제를 해결했다. 또 게임 화면으로 학습을 하도록 영상인식에 뛰어난 컨볼루션 신경망도 적용했다. 이렇게 RL의 DQN과 딥러닝의 컨볼루션 신경망을 적용한 프로그램은 화면에 표시되는 점수를 통해 어떤 동작이 점수를 더 얻고 어떤 동작이 점수를 얻지 못하는지 스스로 학습하면서 동작을 개선해 나갔다.
2013년경에 프로그램은 아타리 2600의 49개 게임 중 29개 게임에 대해 인간 수준의 게임 능력을 보여줬고, 일부 게임에 대해서는 사람을 훨씬 넘어서는 초인간적인 게임 능력을 보여줬다. 많은 사람에게 깊은 인상을 남긴 것은 ‘벽돌 깨기’ 게임이었다. 실행 초기에는 번번이 공을 놓쳤지만, 수백번의 훈련 이후에는 공을 놓치지 않게 되었다.
특히 이후에는 벽돌의 한부분만 집중 공략해 구멍을 내고, 그 구멍으로 공을 넣어 뒷벽과 벽돌의 뒷면 사이에서 공이 반복적으로 부딪혀 많은 점수를 얻는 동작을 스스로 발견해 냈다. 이 프로그램이 실리콘 밸리의 투자가들에게 알려지자, 페이스북과 일론 머스크, 구글 등이 관심을 갖게 됐고, 결국 구글에 인수됐다.
문병성 싸이텍 이사 moonux@gmail.com
