실험 통해 스스로 멀티태스킹 학습하는 신개념 AI 개발

실험하는 법을 배운 에이다가 즉석에서 경사로를 만들어 위로 올라가고 있다. (사진=딥마인드)
실험하는 법을 배운 에이다가 즉석에서 경사로를 만들어 위로 올라가고 있다. (사진=딥마인드)

딥마인드가 인간만큼 빠르고 정확하게 과제를 해결할 수 있는 적응형 인공지능(AI) ‘에이다(Ada)’를 개발했다고 전문 매체 테크타임스가 31일(현지시간) 보도했다.

이에 따르면 적응형 에이전트 또는 에이다라는 AI는 단순히 특정 과제를 해결하는 데 필요한 기술을 개발하는 대신 여러 기술을 실험하고 탐구하고 익힌 뒤 이전에는 본 적 없는 형태로 과제를 수행해낸다. 이런 방식은 AI가 사람처럼 생각하고 판단할 수 있는 '범용인공지능(Artificial General Intelligence)'의 출발점이라고 할 수 있다는 게 테크타임스의 설명이다.

딥마인드의 알파제로와 같은 기존 AI는 체스와 바둑에서 세계 최고의 인간 플레이어를 이겼지만, 이는 한 번에 하나의 게임만 배울 수 있을 뿐이다. 체스를 익히고 난 다음 백지상태에서 바둑을 다시 익혀야 했다 . 

반면에 에이다는 특정한 목적 없이 다양한 작업을 익히기 위해 만든 가상 놀이터인 ‘엑스랜드(Xland)’에서 훈련했다. 엑스랜드는 끊임없이 새로운 과제를 부여하는 방식으로 AI에게 전반적인 기술을 가르친다. 

엑스랜드(영상=딥마인드)

엑스랜드는 비디오 게임과 유사한 3D 공간으로서, AI들은 색깔을 통해 공간을 감지할 수 있다. 이 공간을 관리하는 ‘중앙 AI(Central AI)’는 게임 환경과 규칙, 플레이어 수를 바꾸는 방식으로 이곳을 이용하는 AI에게 수십억개의 다른 과제를 부여한다. 이 환경을 통해 에이다는 훈련하는 방법과 훈련하는 게임을 제어하는 ​​새로운 학습 알고리즘을 일반화할 수 있다.

예를 들어 훈련 중에 플레이어는 먼저 보라색 큐브를 찾거나 빨간색 바닥에 노란색 공을 놓는 것과 같은 간단한 1인용 게임을 수행한다. 그런 다음 숨바꼭질이나 깃발 뺏기와 같은 더 복잡한 멀티플레이어 게임을 수행한다. 이 게임에서는 팀이 상대의 깃발을 가장 먼저 찾아 움켜쥐기 위해 경쟁한다. 특정한 목표는 없지만 시간이 지남에 따라 게임을 통해 플레이어의 과제를 수행하는 능력이 향상된다.

이는 목적 없는 놀이를 통해 인간과 다른 동물들이 배우는 방식과 여러 면에서 흡사하다. 하지만 이를 위해서는 방대한 양의 데이터가 필요하다. 이를 위해 엑스랜드는 끝없는 과제 도전을 통해 해당 데이터를 자동으로 생성한다. 

훈련 중에 과제는 균일하게 샘플링되고 이후에 필터링돼 끊임없이 변화하는 '과제 풀'을 생성한다. 이런 과제에 대한 훈련을 마친 에이다는 인간만큼 효율적으로 다른 과제에 적응할 수 있다. (사진=딥마인드)
훈련 중에 과제는 균일하게 샘플링되고 이후에 필터링돼 끊임없이 변화하는 '과제 풀'을 생성한다. 이런 과제에 대한 훈련을 마친 에이다는 인간만큼 효율적으로 다른 과제에 적응할 수 있다. (사진=딥마인드)

기존 강화 학습 AI가 하는 것과 같이 각 상황에서 가장 좋은 방법을 배우는 대신, 에이다는 실험하는 방법을 배운다. 즉 특정 게임에서 이길 때까지 물체를 움직여 무슨 일이 일어났는지 확인하거나, 한 물체에 도구를 사용해 다른 물체에 도달하거나 숨는 방법을 배운다. 유용한 것을 발견할 때까지 물체를 던져보거나 큰 타일을 이용해 경사로를 올라가기도 한다. 

에이다는 실험을 통해 배운 방법을 활용해 복잡한 새로운 과제를 빠르게 수행해낼 수 있다. 이 과정에서 강화학습을 기반으로 성공이 무엇인지 배우고 그 규칙을 알아내고 어떻게 성공할 수 있는지 파악한다.

단순히 과제를 해결하는 능력 외에도 에이다는 게임 내에서 서로 조정하고 협력해야하는 과제도 수행했다. 예를 들어 협동 요리 게임을 성공리에 수행할 수 있었다.

변화하는 환경에서 과제를 해결하는 이런 능력은 육체노동 및 자율주행 자동차와 같은 실제 응용 프로그램에 도움이 될 가능성이 크다고 테크타임스는 전했다. 또 여러 다른 연구 및 응용 분야에 상당한 영향을 미칠 가능성이 있다고 덧붙였다.

테크타임스는 "AI가 변화하는 환경에서 인간만큼 빠르고 정확하게 과제를 완료할 수 있다는 것은 놀라운 성과"라며 "이것은 AI의 미래를 위한 새로운 기회를 열어준다"고 밝혔다.

박찬 위원 cpark@aitimes.com

키워드 관련기사
  • 딥마인드, 축구하는 AI 휴머노이드 개발
  • 딥마인드의 가토(GATO)가 인간 수준의 AI? “해로운 주장”
  • 비디오 보고 행동 학습하는 AI