인간의 IQ 테스트처럼 인공지능의 지능도 측정이 가능할까?
러시아의 이론 물리학자인 아자마트 압둘라예프(Azamat Abdoulaev) 박사는 최근 영국의 기술 전문 매체 [BBN Times]에 기고한 칼럼에서 인공지능(AI)의 지능을 테스트할 수 있는 4가지 방법을 소개했다.
아자마트 압둘라예프(Azamat Abdoulaev)는 인간과 컴퓨터를 위한 표준 온톨로지의 범용 세계 모델을 도입했으며, 수학과 이론 물리학 박사 학위를 갖고 있다.
우선 그는 “인공지능(AI)은 가까운 미래에 인간의 지능(HI)을 능가할 가능성이 있다”며“하지만 기술이 엄청나게 발전한다 해도 아직은 멀었다”고 전제를 달았다.
그의 주장에 따르면 인간과 인공지능의 지능 테스트 과정을 비교해볼 때 양측의 기준이 서로 다르다는 것이다. 즉 인간은 경험을 통해 배우고 다른 인지 과정을 통해 새로운 환경에 적응하는 것을 목표로 하는 반면 인공지능(AI)은 인간의 행동을 모방하고 따라하면서 그것을 능가하는 것을 목표로 한다.
다양한 지능 측정 방법 개발돼
먼저 그는 인간의 지능을 측정하기 위해 개발된 테스트 방법들을 예로 들면서“인간의 지능은 집단 또는 개별적으로 시행되는 테스트에 의해 측정된다”고 말했다.
철학자와 심리학자들은 지능을 개념화하고 측정하는 방법에 대해 오랫동안 논쟁을 벌여왔다. 즉, 그 논쟁의 요소는 지능의 종류가 얼마나 많은지, 지능에서 자연 대 육성의 역할, 지능의 사회적, 생물학적, 환경적 결정 요소는 무엇인지 또는 지능이 뇌에서 어떻게 표현되는가 등에 대한 것들이다.
이를 통해 다양한 척도들이 개발됐는데 1900년대에 알프레드 비넷(Alfred Binet)과 사이먼(T. Simon)이 최초의 지능 테스트인‘학교에서의 지능 테스트’를 개발했다. 여기에는 사물의 이름 짓기, 단어 정의, 그림 그리기, 문장 완성, 항목 비교, 문장 구성 등의 다양한 질문들이 포함돼 있다.
또 지능 지수(IQ)는 나이에 따라 달라지는 지능의 척도로 널리 채택되는 기법이다. 이 지수는 인간의 지능을 평가하기 위해 고안된 일련의 표준화된 테스트라고 볼 수 있으며 총 점수로 지능을 나타낸다.
또 스탠포드-비넷(Stanford-Binet) 테스트가 있는데 이는 어휘, 그림 기억, 익숙한 사물의 이름 짓기, 반복 문장, 그리고 다음 명령을 포함한 다양한 작업으로 구성된 일반적인 지능의 척도다.
웩슬러 성인 지능 검사 또는 웩슬러 성인 지능 척도(Wechsler Adult Intelligence Scale, WAIS)는 미국에서 가장 널리 사용되는 IQ 테스트로 알려져 있다. 130이 넘는 IQ 점수는 일반적으로 높은 지능과 관련이 있는 것으로 인정된다. 70점 이하는 보통 걱정거리로 볼 수 있는데 그것은 기초적인 학습 장애를 나타낼 수 있기 때문이다.
AI 지능의 4가지 척도
그럼 인간이 부여한 학습 기능을 통해 지능의 지평을 넓혀가는 AI의 지능의 기준은 과연 무엇일까?
그는 “인공지능(AI) 시스템의 지능을 크게 네 가지 방법으로 측정할 수 있다”고 밝혔다.
첫째 AI의 광범위한 기능(Breadth)을 제시했다. 우리가 지능적이라고 여기는 시스템들은 광범위한 능력을 가지고 있다. 이른바 강력한 AI 시스템은 인간 엔지니어가 소스 코드를 직접 수정하지 않고도 어떤 작업도 학습할 수 있는 기능이 있다.
즉, 이렇게 광범위한 AI 시스템을 갖추려면 하나의 알고리즘이 아닌 일련의 기본 학습 알고리즘이 필요하며 딥마인드의 경우 AI의 더 넓은 버전인 인공 일반 지능(AGI)과 같은 일련의 범용 학습 알고리즘을 찾고 있다. 사실 이 한 가지만으로도 AI 시스템이 얼마나 지능적인지 측정할 수 있다.
둘째 AI의 데이터 요구 조건이 있다. 강력한 AI 시스템은 가능한 한 적은 데이터로 문제를 모델링하는 반면에 거대한 스케일의 데이터를 소비하고 그것을 이해할 수 있어야 한다.
따라서 매우 적은 훈련 데이터로 일반화하는 능력은 막대한 양의 데이터를 소비하는 것보다 더 지능적이라는 것이 그의 주장이다.
셋째 지도 대 비지도의 문제로 AI의 지능을 잴 수 있다는 것이다. AI에서 지도 학습과 비지도 학습은 모두 중요하지만 비지도 학습은 더 지능적인 것으로 간주된다. 그 이유는 최소한의 감독에 의해 스스로 학습하는 시스템은 감독을 더 많이 필요로 하는 시스템보다 더 지적인 것으로 여겨지기 때문이다.
이는 인간의 지능에서도 강하게 드러나는 현상으로 코딩을 스스로 할 수 있는 아이는 더 지능적이라고 여겨진다.
마지막으로 AI의 예측 기능을 예로 들었다. 그는 계획과 추론에 필수적인 예측은 매우 강력한 지능의 기능이라고 주장했다. 인간은 강력한 예측 능력을 갖고 있고 항상 무언가를 기대하고 장단기적으로 그것을 계획하려고 노력한다.
단기 예측의 경우 자신에게 던져진 공을 잡고 싶을 때 공의 궤적을 예측해 잡는다. 장기 예측은 계획이라 불리며 말 그대로 목표를 달성하기 위해 어떻게 행동할지를 생각해내는 것이다.
예를 들면 하와이로 휴가를 갈 때, 마음의 어떤 예측적인 기능이 작용해서 계획을 세우는 것이다. 그는 “예측은 바로 지능이다”고 강조했다.
AI타임스 조행만 객원기자 chohang5@kakao.com
