구글, AI 딥 강화학습 알고리즘 고안…인간 개입 최소화
4족 보행 로봇 ‘레인보우 대시’…스스로 보행 학습 가능

(사진=Google Robotics). ©AI타임스
(사진=Google Robotics). ©AI타임스

구글의 로봇공학 연구팀이 인간의 개입이 필요 없는 AI 기반 4족 보행 로봇을 공개했다.

최근 미국 기술전문잡지 ‘MIT 테크놀로지 리뷰’ 등 외신 보도에 따르면 구글 연구진은 ‘딥러닝’과 ‘강화학습’을 결합한 ‘딥 강화학습(deep reinforcement learning) 알고리즘’ 개발을 통해 AI 자율학습 로봇 개발 연구에 있어 의미 있는 성과를 내놨다. 로봇이 인간의 도움 없이도 보행하는 방법을 터득함으로써 로봇 스스로 학습할 수 있는 가능성이 열린 셈이다.

연구진은 ‘레인보우 대시(Rainbow Dash)’라고 명명한 4족 보행 로봇을 대상으로 새롭게 개발한 AI 알고리즘을 테스트했다. 특히 이번 테스트는 학습과정에 소요되는 시간 단축을 위해 현실세계 환경에서 이뤄졌다. 그 결과 로봇은 환경 조건에 따라 편차는 있었으나 불과 몇 시간 만에 자율적으로 앞뒤로 걷고 좌우로 도는 방법을 터득해냈다.

(사진=Google Robotics). ©AI타임스
(사진=Google Robotics). ©AI타임스

기존의 강화학습 알고리즘은 로봇이 시행착오를 거쳐 움직임을 학습하도록 하는 데 여전히 인간의 개입에 크게 의존하고 있다. 로봇이 쓰러지거나 훈련 환경에서 이탈할 때마다 누군가는 로봇을 들고 올바른 위치로 되돌려 놓아야 한다. 물론 레인보우 대시 로봇 역시 인간의 개입이 전혀 없는 것은 아니었다. 현재로서 이 로봇은 경계가 설정된 특정 범위 내에서만 자율 학습이 가능하다. 연구진은 인간 개입 없이 학습 가능한 공간의 범위를 설정하고 그 개입을 최소화했다.

또 일반적으로 강화학습 알고리즘 테스트는 컴퓨터 시뮬레이션을 통해 수행된다. 알고리즘이 안전하게 작동할 수 있을 만큼 견고해질 때까지 똑같은 조건의 가상 환경에서 똑같이 만든 가상 로봇이 사용된다. 그 과정을 거친 다음 실제 로봇에 대입을 하는 것이다. 그러나 이번 연구의 경우 처음부터 바로 현실세계에서 로봇 훈련이 이뤄졌다. 시험 횟수와 오류를 줄이면서 시행착오를 통해 학습할 수 있는 보다 효율적인 딥 강화학습 알고리즘이 사용됐다.

연구진은 이동성 측면에서 보행 로봇의 적용분야가 점점 더 확대될 것으로 기대하고 있다. 지에 탄(Jie Tan) 구글 연구원은 “다리를 가진 보행 로봇의 경우 이동성이 뛰어나 인간이 갈 수 있는 장소는 물론 인간이 갈 수 없는 환경까지 접근할 수 있다”고 설명했다. 이어 해당 로봇에 대해 “지금은 아직 연구 초기 단계”라며 “향후 더욱 다양한 환경에서 광범위한 로봇들을 대상으로 학습 시스템을 테스트할 계획”이라고 덧붙였다.

키워드 관련기사
  • 코로나19, 세계 상대로 '전쟁 선포'
  • 코딩대신 AI 딥러닝으로 로봇 개발