© shutterstock
© shutterstock

(AI타임스=전승진 기자) 모든 신기술에는 양면성이 있다. 실제 신기술이 활용되는 현장에서는 그 단점을 마주하게 된다. 인공지능(AI)도 만능 시스템처럼 보이나 아직 보완해야 할 취약점이 존재한다.

첫 번째로 인공지능(AI)는 데이터 의존도가 매우 크다. 인공지능(AI) 기술을 실제로 활용하려면 알고리즘을 학습시킬 수 있을 만큼 큰 데이터를 확보해야 한다. 의료 분야에서는 정확한 진단을 위해 방대한 데이터가 필요하다. 수만개의 유전자 정보, 수백 개의 의학저널 등의 지식뿐 아니라 방대한 양의 임상시험 데이터도 필요하다. 이러한 데이터를 확보하거나 데이터에 접근할 수 없다면 인공지능(AI)을 제대로 활용되기 어렵다. 암 환자를 진료하려면 개인 병력과 치료 결과, 과거 환자 사례 등 다양한 데이터를 학습해야 하지만 방대한 관련 데이터를 모으기에는 각종 규제 등 현실적으로 어려움이 있다. 특히 희귀암이나 재발암 등에 대해서는 데이터 부족으로 의료 성과를 내지 못하고 있다.

두 번째는 데이터의 편향성이다. 인공지능(AI) 학습을 위한 데이터가 편향되어 있으면 인공지능(AI)의 판단 또한 편향될 수 있다. 아마존에서는 머신러닝 기반 500대 컴퓨터를 동원해 구직자 지원서를 5만여 개 키워드로 분석했다. 학습을 시작한지 1년여가 지나자 이 인공지능(AI)이 경력 10년 이상의 남성 지원자만 후보로 고르기 시작했다. 여성이라는 단어가 들어가면 감점을 하기도 했다. 기존 IT 기업에 남성 지원자가 압도적으로 많았기에 이러한 데이터를 기반으로 한 인공지능이 남성 편향적으로 지원자를 분류한 것이다.

세 번째는 인공지능(AI)의 취지와 달리 인간의 노동이 아직 많이 필요하다는 점이다. 현재 인공지능(AI) 서비스의 90%는 지도학습 방식이다. 딥러닝 방식이 아닌 지도학습 방식은 사람이 데이터를 일일이 분류하고 가공작업까지 해야 한다. 인공지능(AI) 알고리즘도 존재하지만 알고리즘 지도를 위해 아직 사람의 손과 시간이 많이 필요한 단계이다.

네 번째는 인공지능(AI)이 도출한 결과를 설명하기 어렵다는 점이다. 딥러닝 처리방식은 블랙박스이다. 딥러닝은 수많은 데이터로 학습을 하고 정확하고 빠른 예측을 할 수 있다. 하지만 어떠한 원리로 예측을 하는지는 엔지니어도 알지 못한다. 가장 진보된 과학이지만 오히려 과학적이지 않은 아이러니한 현상이다. 이러한 처리 과정을 알 수 없는 방식 때문에 데이터의 편향성이 발생한다. 엔지니어도 전후 사정을 정확하게 파악할 수 없기 때문에 잘못된 판단이나 윤리적인 문제가 발생할 수 있다.

다섯 번째는 간접학습의 어려움이다. 어느 특정 산업에서 성숙한 인공지능(AI)은 다른 분야에서 똑같은 활약을 하지 못한다. 학습하는 배경과 데이터가 다르기 때문에 그대로 적용할 수 없다. 의료분야에서의 인공지능(AI)이 헬스케어 시장을 개척하는데 성공하더라도 같은 알고리즘을 금융시장에 활용하려면 데이터 확보 후 새로운 학습을 시작해야 한다. 환경이 바뀌게 되면 재교육을 해야 한다는 점은 알고리즘의 확장성 측면에서 한계점이라고 볼 수 있다.

 

【에이아이타임스 aitimes 에이아이타임즈】