(사진=Yang et al).
(사진=Yang et al).

마치 어린아이가 걸음마를 배우듯 넘어졌을 때 어떻게 몸을 일으켜 일어나야 하는지 혹은 어떻게 걸어야 하는지 배울 수 있는 로봇 개가 탄생했다.

중국 저장대(ZJU)와 영국 에든버러대(UOE) 공동 연구진이 인공지능(AI) 강화학습을 통해 다양한 상황에 대처하는 방법을 배울 수 있는 일명 ‘주잉(Jueying)’ 로봇 개를 개발했다고 6일(현지시간) IT 전문매체 엔가젯(Engadget) 등 외신이 전했다.

(사진=Yang et al).
(사진=Yang et al).
(사진=Yang et al).
(사진=Yang et al).

연구진은 인간의 뇌를 모방하도록 설계된 심층 신경망을 로봇 개의 컴퓨터 모델을 훈련시키는 데 사용했다. 인간은 대부분 시행착오를 거쳐 학습한다. 이 로봇 개도 AI 강화학습을 통해 걷고 달리고 넘어졌을 때 다시 일어나는 것은 물론 공격을 받으면 스스로 방어하는 등 인간처럼 여러 과제를 해결하는 방법을 배운다.

로봇 개는 과제를 잘 수행하면 보상을 받는다. 만약 제대로 해내지 못할 시 디지털 방식을 통해 부정적 행동으로 기록된다. 즉 연구진은 인간이 시행착오를 거쳐 배우는 과정과 마찬가지로 로봇의 학습 훈련을 위해 정교한 시행착오 방법론을 적용한 셈이다.

(사진=Yang et al).
(사진=Yang et al).

이번 연구 성과에 관한 논문은 로봇공학 분야 국제학술지인 ‘사이언스 로보틱스(Science Robotics)’에 실렸다. 논문 저자 가운데 한 명인 츠빈 리 에든버러대 로봇공학자는 이 같은 AI 강화학습 접근법에 대해 ”시뮬레이션 환경에서 가능한 모든 시나리오를 만들어낼 수 있다“면서 ”각기 다른 환경 또는 환경 설정을 만들어내는 것도 가능하다“고 설명했다. 

우선 연구진은 로봇의 가상 버전을 위해 소프트웨어를 훈련시켰다. 로봇 개가 다양하고 복잡한 기술을 학습‧개발할 수 있도록 8가지 AI 알고리즘 전문가로 구성된 학습 아키텍처를 개발한 것이다. 구글이 최근 인공지능 ‘뮤제로(MuZero)’ 알고리즘을 훈련시키는 데 사용한 것과 유사한 접근방식이다.

(사진=Yang et al).
(사진=Yang et al).
(사진=Yang et al).
(사진=Yang et al).

예를 들어 로봇이 울퉁불퉁한 표면에서 넘어지는 것처럼 어려운 과제에 부딪혔을 때 각 알고리즘 전문가는 그때그때 필요한 기술에 따라 로봇에게 다시 일어서기 위해 어떻게 해야 하는지를 알려준다. 로봇은 임무를 성공적으로 완수하면 보상으로 가상 포인트를 받으면서 경험을 통해 다시 일어서는 법을 학습하게 된다.

로봇이 일상생활에서 상용화되기 위해서는 이러한 학습법이 필요하다. 실제 상황에서는 예측할 수 없는 변수가 많아 연구진이 모든 경우에 대비해 로봇을 코드화하는 일은 불가능하기 때문이다.

(사진=Yang et al).
(사진=Yang et al).

기존에 널리 알려진 보스턴 다이내믹스(Boston Dynamics)의 4족 보행 로봇 ‘스폿(Spot)’의 경우 잘 코드화돼 있어 주어진 업무를 훌륭하게 수행하면서 다양한 분야에서 활약을 펼치고 있다. 단 업무 능력은 뛰어나지만 소프트웨어에서 다루지 않은 상황에는 적응하기 어렵다는 단점이 있다.

연구진은 이번에 개발한 로봇 개가 강화학습을 통해 업무를 수행해낸다는 점을 차별화된 강점으로 꼽는다. 물론 이 로봇 개를 스폿과 겨룰 수 있을 만큼 실생활에서 유용하게 사용하기 위해서는 시뮬레이션에서 로봇 훈련에 필요한 계산량을 줄이는 등 해결해야 할 과제들이 아직 많이 남아있다.

연구진은 인간 아기가 배우는 과정과 동일한 방식으로 로봇도 학습할 수 있도록 가르치는 게 이번 연구의 목표라고 말한다. 향후 즉흥적으로 상황에 대처할 수 있는 유연성과 적응력을 갖춘 좀더 지능적인 기계들을 개발해 기존에 해본 적 없는 다양한 업무를 처리할 수 있게 될 것이라는 게 연구진의 설명이다.

AI타임스 윤영주 기자 yyj0511@aitimes.com

[관련기사] ”로봇아 잘했어“…강아지 훈련시키듯 로봇도 가르친다

[관련기사] 로봇의 진화, 정말 쓸만해지고 있다...”문도 열고 충전도 알아서 척척"

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지