작고 심플한 뉴럴 네트워크, 자율주행차 도입 앞당긴다

MIT CSAIL·TU 비엔나·IST 오스트리아 연구팀 네이처에 공개
네트워크 크기 2배 감소, 7만5000개 매개변수 사용
네트워크 결정 자세히 해석, 노이즈 대처 강점
자율주행처럼 변수가 많은 고난도 AI 업무에 활용 기대
블랙박스 머신러닝 시스템 대안으로 제시

크기가 작고 구조가 간단한 뉴럴 네트워크가 기존 기술보다 효율적이고 신뢰할 수 있다는 연구 결과가 나왔다. 간소화된 네트워크 형태로 AI 모델 수행·판단 과정을 수월하게 이해하고 훈련 시간을 줄일 수 있게 됐다. 자율주행차와 같은 고난도 AI 업무에 기존 블랙박스 머신러닝 시스템 대신 도입 가능하다.

MIT CSAIL(컴퓨터 과학 및 인공지능 연구소)는 TU 비엔나, IST 오스트리아와 함께 하는 국제연구팀에서 기생충과 같은 작은 동물의 뇌를 모사해 차세대 AI 시스템을 개발했다고 13일 밝혔다. 해당 연구인 ‘유동성 타임 콘스턴트 망(Liquid Time-constant Networks)’이 네이처 머신 인텔리전스에 수록돼 업계 전문가들의 관심을 받고 있다.

최종적으로 차를 운전하는 컨트롤 타워인 인공신경정책망(Neural Circuit Policy, NCP) 뉴런 수는 19개로 크게 줄었다. 기존 모델보다 2분의 1 수준의 뉴런으로 도로를 벗어나지 않고 차를 운전할 수 있다. 훈련에 사용하는 매개변수도 7만5000개를 사용했다.

연구에 사용한 네트워크는 총 2개다. 먼저 합성곱 신경망(Convolutional Neural Network, CNN)이 카메라가 비춘 도로 현장 데이터를 처리한다. 픽셀값을 통해 구조 특징을 파악하는 식으로 시각 데이터만 처리한다. 처리 과정에서 중요한 이미지 값을 파악해 중요부인 컨트롤 시스템에 신호를 보낸다. 자율주행차 운전대를 조종하는 것은 19개 뉴런으로 구성된 NCP로 CNN이 전송한 데이터를 인식 모듈 형태에서 운전 수행값으로 전환한다.

시스템 훈련에는 보스턴 지역에서 수집한, 사람이 운전하는 교통 영상 데이터를 대량 이용했다. 이 데이터를 2개 네트워크가 활용해 다양한 현실 상황에서 어떻게 차를 운전할 지 판단했다. 훈련은 시스템이 스스로 이미지 데이터를 운전에 연결시키고 새로운 환경에도 적응할 수 있을 때까지 진행했다.

연구팀은 이 새 AI 시스템 효과를 증명하기 위해 실제 자율주행차를 이용해 실험했다. 실험 결과, 차도와 보도 사이를 가르는 연석과 운전 중 보는 시야를 모두 포함해 실제 운전과 관련된 굉장히 구체적인 부분에 초점을 맞추는 것으로 나타났다.

MIT CSAIL 연구원 라미 하사니는 “이와 같은 AI 행동은 기존 시스템에서 볼 수 없었던 굉장히 특별하고 바람직한 성과다. 운전에 대한 AI 판단에 관여하는 뉴런 하나하나의 역할을 확인할 수 있었다. 이 정도로 자세한 해석은 크기가 큰 딥러닝 모델에서는 불가능한 것”이라고 설명했다.

연구팀이 개발한 NCP는 노이즈 처리에서도 기존 모델들을 능가했다. 이미지 데이터에 노이즈를 섞어 혼란을 주고 처리 능력을 평가한 결과 화상 데이터 내 결함(input artifacts)에 강한 저항을 보이는 것을 확인했다. 하사니 연구원은 “이는 다른 뉴럴 네트워크는 극복할 수 없는 문제다. 새로운 뉴럴 모델과 아키텍처의 분명한 성과”라고 강조했다.

다른 장점으로는 모델 훈련 시간을 줄이는 것, 보다 간단한 시스템에서 AI를 이용할 수 있는 것을 제시했다. 자율주행차 뿐만 아니라 물류센터 자동화 시스템부터 로봇 이동에까지 활용할 수 있는 범위가 다양하다는 주장이다.

라두 그로수 팀장(TU 비엔나 사이버 피지컬 시스템 연구팀)은 “수 년동안 딥러닝 개선을 위해 자연으로부터 무엇을 배워야 할 지 연구해왔다. 선충류 신경계는 정보를 처리하는 방식이 효율적이고 조화롭다. 예쁜 꼬마 선충(nematode C. elegans)은 굉장히 적은 수의 뉴런으로 수명을 이어가고 흥미로운 행동 패턴을 보인다”며 연구 배경을 설명했다.

하사니 연구원은 “생물학적 신경계 계산 원리가 고성능 해석 AI 구축에 중요한 리소스가 될 수 있었다. 이번 연구는 AI 커뮤니티에 새로운 관점을 열어준다. 블랙박스 머신러닝 시스템도 대체할 수 있을 것”이라고 말했다.

블랙박스 머신러닝 모델은 심층 신경망(DNN, Deep Neural Network)을 비롯한 다양한 모델을 조합하고 다수 매개변수를 사용해 고성능 AI 업무에 주로 사용한다. 복잡성으로 인해 예측 능력은 뛰어나지만 모델 내 개별 알고리즘을 명확히 알 수 없다는 한계가 있다.

[관련기사] AI 자율주행 시대 음주운전 사고 없어질까

신호 위반을 목격한 AI “이건 안 배울게요”

박성은 기자 AI는 마법이 아닌 과학입니다 sage@aitimes.com

다른기사 보기

상단영역

본문영역

SNS 기사보내기