인간은 공부(학습)하면 할수록 자신이 할 수 있는 일과 그렇지 못한 것에 대해 스스로 판단능력을 기른다. ‘학습역량 진단 및 개선’에서 AI는 인간처럼 꾸준한 학습을 통해 그 역량을 높여 자발적으로 올바른 결정을 내린다.
딥러닝을 통한 학습 결과는 그 정확성이 매우 높다. 하지만 딥러닝 학습 방식은 따지고 보면 주입식에 지나지 않는다. 연구자들은 AI가 학습역량 기술 단계에서 인간처럼 습득한 지식을 체계화 시켜, 문제 발생 시 알아서 진단·개선하는 학습역량(Learning Competency)을 가르치기 시작했다. 환경 변화에 스스로 적절한 상황판단을 내리는 수행역량(Task Competency)도 여기에 포함된다.
이 연구는 ▲학습역량 지식화(Self-Knowledge of Competency) ▲학습역량 인지학습(Competency-Aware Learning) ▲학습모델 신뢰도 평가(Trustworthy Evaluation) 등 총 세 가지 세부단계를 거쳐 완성된다.
1) 학습역량 지식화(Self-Knowledge of Competency)
늘 똑같은 주입식 방식에서 탈피해 습득한 지식을 ‘경험화’ 하는 단계다. AI는 이를 통해 새로운 환경·조건에 놓였을 때 능동적으로 대처할 능력을 기른다.
2) 학습역량 인지학습(Competency-Aware Learning)
AI는 창의적 판단을 요하는 공부를 하며 점진적으로 경험세계(Experience World), 가상 현실세계(Artificial Real World)에서 오픈환경(Open Environment), 현실세계(Real World) 태스크에 바로 적응할 수 있게 된다.
3) 학습모델 신뢰도 평가(Trustworthy Evaluation)
학습역량 기술을 사용자에게 신뢰할 수 있는 방법으로 제공하며 상호작용을 통해 검증하는 단계다.
◆기술동향
현재 국내외 대규모 AI 연구기관은 기존에 높은 정확성을 목표로 하는 연구에서 스스로 역량을 강화하는 AI 연구로 확장하고 있는 추세다.
1) 미 국방부 고등계획연구국(DARPA, 다르파)
다르파는 ▲자기지식화(Self-Knowledge of Experience) ▲작업전략 지식화(Self-Knowledge of Task Experience) ▲기술에 대한 역량인지 기계학습(Competency-Aware Machine Learning, CAML) 프로젝트에 투자하고 있다. 프로젝트 기간은 2023년까지다.
이와 별개로 다르파는 지난해부터 인간과 AI가 다양한 환경에서 상호협력을 목표로 ‘사회적 AI를 위한 연구’라는 이름의 ASSIST 프로젝트를 진행 중이다. 습득한대로 임무를 수행하는 것 외에, 스스로 관찰하고 이해하는 AI 기술에 관한 연구다. 또 시간에 대한 개념을 깨우치는 ‘시간 인지 머신러닝(TAMI)’ 연구도 하고 있다.
2) 한국과학기술원(KAIST, 카이스트)
카이스트는 입력 데이터 내 노이즈가 발생하는 비정상 상황도 인지·고려하는 AI를 연구 중이다. 궁극적으로 불확실한 입력 데이터에 당황하지 않고 즉각 ‘모르겠다(I don’t know)’라고 판단을 내리는 유연한 판단력의 AI를 개발하는 연구다. 2018년 카이스트는 실험을 통해 기존 어텐션 매커니즘(딥러닝 모델이 특정 벡터에 주목함으로써 모델의 성능을 높이는 기법)으로 완성한 AI 모델보다 입력 데이터에 노이즈를 섞어 학습한 모델이 변화에 능동적으로 적응하고, 정확한 판단력을 갖는다는 것을 확인했다.
3) 카카오브레인과 울산과학기술원·서울대학교
카카오브레인은 국내 대학들과 각종 연구를 진행 중이다. 먼저 카카오브레인은 2018년부터 울산과학기술원(UNIST, 유니스트)과 데이터 내 노이즈로 인해 정확한 답을 유추하지 못하는 상황에서 스스로 잘못된 데이터를 수정하는 ‘범용AI’를 연구하고 있다. 사용자에게 최상의 신뢰성을 얻을 수 있는 기술로, 이미지분류·회귀분석·강화학습에도 적용될 수 있다.
또 서울대와는 자율주행차를 제어하는 모형을 개발했다. 혼합밀도신경망(Mixture Density Network)을 사용한 연구로, 불확실성을 제어하고 적절한 판단을 내려 기존보다 30% 이상 안전성을 확보했다.
4) 토론토대학교
토론토대는 AI가 기존 학습을 통해 스스로 판단하는 내용의 연구를 진행 중이다. 연구진은 기존 이미지 분류 학습에서 벗어나 적은 데이터만 주어진 상황에서도 학습이 가능한 데이터셋을 구축했다. 전혀 다른 10가지 이종 도메인 이미지 데이터셋을 통합해 학습역량을 측정하는 방식이다.
5) 버클리대학교 인공지능연구소
버클리대 인공지능연구소는 AI가 새로운 환경에 적응하도록 모사학습 연구를 실시하고 있다. 이곳 연구진은 인간의 행동을 따라하는 모사학습 실험을 통해 로봇팔이 빠른 속도로 적응해 가는 것을 확인했다.
6) OpenAI
오픈AI는 로봇 제어 강화학습 훈련에서 큰 문제였던 시뮬레이션과 실제 환경의 오차를 줄이는 연구를 진행하고 있다. 시뮬레이션에서 물리적 요소를 무작위로 설정, 다양한 가상환경을 구축함으로써 AI모델의 적응력을 높인다. 이를 통해 완벽한 목표 수행이 가능한 ‘도메인 랜덤화(Domain Randomization) 기술’을 제안한다.
◆시장동향
미 방위산업체 레이시온은 다르파 CAML 프로젝트에 참여하면서 군수분야 내 ‘신뢰할 수 있는 AI 시스템’을 개발하고 있다. 세계 최대 항공 방위산업 기업 중 하나인 영국의 BAE 시스템스는 머신러닝이 스스로 ‘감사(Audit)’하는 기능을 탑재한 마인드풀 소프트웨어 개발에 착수했다.
연구진은 앞으로 배달로봇을 비롯해 공장 등 산업체에서 인간을 대신해 업무를 수행하는 로봇, 자율주행차가 상용화 될수록 학습역량 인지 및 개선 기술이 더욱 요구될 것으로 전망하고 있다.
◆발전 전망
현재까지 학습역량 진단 및 개선의 세분화 연구 완성도는 평균 55%라는 낮은 완성도를 기록하고 있다. 대학 내 AI연구기관을 중심으로 데이터 불확실성에 관한 연구가 활발히 진행되는 것에 비해 다양한 응용방법에 기초한 범용모델·강화학습 연구는 제대로 이뤄지지 않고 있다. 보다 높은 신뢰도를 확보하는 연구나 여러 가지 태스크를 제시해 자율적인 상황판단 능력을 길러주는 연구도 기존 수행방식을 탈피하지 못하고 있다.
이에 연구항목을 ▲학습역량 구축 ▲태스크에 종속되지 않는 알고리즘 연구 ▲자율의사결정 응용 등 세 가지로 세분화 시켜 단기(~2022년)·중기(2023~2026년)·장기(2027~2030년) 연구개발이 요구되고 있다.
"인공지능과 자연지능 연계 집중할 때" AI 기술청사진 연구 총괄 IITP 박상욱 팀장
[특별기획] 인공지능 기술 청사진 2030 연재순서 표
AI타임스 박혜섭ㆍ이하나 기자 phs@aitimes.com
