구글(Google)이 인간의 언어를 이해하고 스스로 생각해서 반응하는 ‘도우미 로봇’을 선보였다.
더버지(The Verge)에 따르면 구글은 16일(현지시간) 자사의 대규모 언어모델인 PaLM을 결합해 자연어 명령을 이해할 수 있는 새로운 로봇 ‘PaLM-SayCan’에 대한 연구를 발표했다. PaLM은 수백 개의 언어 이해 및 생성 작업을 할 수 있는 5,400억 개의 매개변수가 있는 언어 모델이다.
대부분의 로봇은 "물 한 병 가져와"와 같은 짧고 간단한 지시에만 응답하지만 PaLM 덕분에 “음료수를 쏟았어. 도와줄래?”라고 했을 때, 로봇은 이 명령을 “주방에서 닦을 스펀지를 가져와”로 해석할 수 있다.
PaLM-SayCan 로봇은 음성 또는 입력된 문장을 이해하고, 궁극적인 목표를 찾아내서 작업 단계를 나누고, 로봇이 가질 수 있는 모든 기술을 사용해 실행한다.
PaLM-SayCan 로봇은 101개 작업 중 전체 계획 성공률 84% 및 실행 성공률 74%를 달성하여 PaLM과 통합되지 않은 초기 모델보다 14% 및 13% 더 작업 성공률이 높다. 기본 언어 모델을 향상시키는 것만으로 로봇의 성능이 향상될 수 있음을 보여준다.
다국어 쿼리와 함께 작동하도록 명시적으로 설계되지는 않았지만 PaLM-SayCan은 이를 처리할 수 있다. PaLM은 다국어 말뭉치에 대해 훈련되었기 때문에 영어 이외의 다국어 쿼리를 처리할 수 있다. 쿼리를 영어에서 중국어, 프랑스어, 스페인어로 변경할 때 계획 성공률 저하가 거의 없다.
AI타임스 박찬 위원 cpark@aitimes.com
[관련기사]주문 4분 후에 햄버거 구워내는 AI 로봇 셰프
[관련기사]로봇이 집안일 하는 시대 다가온다
- “로봇이 뿔났다”…체스 경기 도중 어린아이 손가락 부러뜨려
- “로봇 앞에선 찬물도 못 마신다?”…사람을 보고 배우는 로봇
- 과기정통부, 18~19일 부산 벡스코서 메타버스 수출 상담회 개최
- 'AI, 훈민정음에 꽃피우다', 한국어 인공지능 경진대회 개최
- 세계 첫 AI CEO 탄생...中 넷드래곤, 경영 효율 높이려 임명
- 웃고 떠드는 AI 로봇 등장
- 구글, 다국어 언어 이미지 모델 ‘PaLI’ 공개
- 비디오 보고 행동 학습하는 AI
- 엔비디아, 비디오 보고 행동 학습하는 AI '마인도조' 공개
- 구글, 사람처럼 보고 듣고 움직이는 '로봇 제어' 인공지능 공개
