(사진=셔터스톡)
(사진=셔터스톡)

두차례의 실망감으로 인공지능(AI) 연구자들에 불신감이 강했던, 그래서 AI의 2차 겨울이라고 하는 AI 연구의 암흑기가 1980년대 중반부터 1990년대 중반까지 이어졌다. 

그런데, AI 연구의 침체기를 의미하는 ‘AI의 겨울(AI Winter)’이라는 용어는 다소 주관적이며, 정확한 시기와 정도에 대해서도 사람이나 기관에 따라 서로 다른 의견을 갖고 있어 합의된 결론은 없다. 앞서 AI의 2차 겨울이 1995년까지 이어졌다고 했지만, 일부에서는 AI의 2차 겨울을 2000년대 중반까지로 보기도 한다.

AI의 역사에 관한 많은 자료를 찾아봐도 1980년대 후반에서 갑자기 2000년대 중반으로 건너뛰는 경우가 많고, 세기말 전후의 상황을 그렇게 비중 있게 다루지는 않는 듯하다. 그렇게 세기말을 전후로 한 시기는 AI의 2차 겨울의 연장선상으로 보는 견해도 있으며, 또 AI의 3차 부흥기의 시작 시기로 보는 견해도 함께 있다. 

필자는 전문가 시스템의 몰락을 가져온 1987년 AI의 2차 겨울이 시작됐고, 진보된 머신러닝 알고리즘의 개발로 통계학적 AI의 접근이 이뤄진 1990년대 중반에 다시 새로운 AI의 시대가 열렸다고 보고 있다. 한편, 2000년대 중반까지를 2차 겨울로 보는 시각은 아무래도 AI의 3차 부흥기를 딥러닝을 중심으로 이해하는 경향을 반영한 것으로, 제프리 힌튼 교수가 심층 신뢰 신경망을 제안한 2006년부터 3차 부흥기가 시작됐다고 보는 견해인 듯하다.

그렇지만 1990년대 중반부터 2000년대 중반까지 세기말을 전후로 AI 역사에서 중요한 연구들이 이뤄졌고, 기념비적인 이벤트들도 꽤 등장했다. SVM과 랜덤 포레스트 같은 머신러닝 알고리즘이 개발되고, LSTM과 같은 새로운 신경망 알고리즘도 개발됐으며, 인간을 완전히 압도한 딥블루의 체스 프로그램과 치누크의 체커 게임 프로그램 등이 등장한 것도 이 무렵이다.

이 시기 AI 연구계 분위기는 '도전'과 '잠재력 확인'이라는 두 단어로 표현할 수 있다. 도전이라는 표현을 사용한 한 이유는 AI의 2차 겨울 시기에 비해 상황이 나아졌다고는 하지만, 여전히 자신의 연구에 AI, 특히 신경망이라는 용어를 사용하는 것에 대해서는 아직 조심스러운 시기였기 때문이다. 

반면, 그동안 경험할 수 없었던 엄청나게 개선된 컴퓨팅 능력을 좀 더 쉽게 활용할 수 있었고, 90년대 초반에 등장한 웹 브라우저 모자이크(Mosaic)와 검색 서비스 야후를 기반으로 90년대 후반에는 본격적인 인터넷의 시대로 접어들며 더 많은 데이터를 좀 더 쉽게 얻을 수 있는 시기이기도 했다. 특히, 오늘날 AI의 중요한 부분 중 하나인 영상 인식의 기반이 된 영상 데이터의 기하급수적 증가도 90년대 후반 디지털카메라가 본격 상용화되고 세계적으로 보급되며 가능해졌다.

이런 세기말 전후의 AI 연구와 활용을 좀 더 깊이 들여다보면, 머신러닝 발전과 응용 분야 발전의 두가지 흐름으로 나누어 볼 수 있다.

머신러닝의 발전으로는 이 기간에 SVM, 랜덤 포레스트와 같은 통계학 기반의 머신 러닝, LSTM과 같은 신경망 머신러닝 기술이 개발됐고, Q-러닝과 같은 강화 학습의 발전이 가속하며 다양한 머신러닝 기술들이 AI의 성능을 향상했다. 

특히, 통계학 기반의 머신러닝은 다양한 기법이 등장했을 뿐만 아니라 현실에 활용 가능했고, 결과도 훌륭한 것으로 드러나며 다양한 분야에 성공적으로 적용되기 시작했다. 지난 수십년 동안 확립된 통계학 연구와 기법을 바탕으로 1990년대에 통계학 이론이 크게 발전했는데, 컴퓨터 성능의 향상으로 대규모 데이터 처리와 반복적인 수치 연산의 통계적 분석을 현실적으로 가능케 해줬다. 이는 통계학 기반의 머신러닝 알고리즘으로 적용돼, 데이터 분석과 가설 검증 및 추론을 위한 강력한 도구로 개발할 수 있는 기반이 됐기 때문이다. 

또 기술 환경적으로, 인터넷의 발달이 다양한 분야에서 디지털 데이터를 급격하게 증가시켜, 머신러닝 알고리즘 학습에 대규모 데이터를 활용할 수 해 줬다. 이런 기술 환경의 발전은 통계학 기반의 머신러닝 알고리즘의 개발과 성능 향상에 핵심적인 기여를 했다. 이는 머신러닝이 데이터 분석, 예측, 의사 결정을 비롯한 광범위한 현실 문제에 적용될 수 있다는 인식을 키워 줬고, 머신러닝 알고리즘 개발에 대한 관심과 투자가 증가할 수 있는 환경을 만들어 줬다. 

통계학 기반의 머신러닝 알고리즘 중 가장 성공적인 알고리즘의 하나로 평가받고 있는 SVM은 이론적 근거가 탄탄할 뿐만 아니라 데이터의 특성에 따라 성능이 크게 달라지지 않는 우수한 일반화 성능을 보여주며, 컴퓨터 비전, 자연어 처리, 금융, 의료 등 다양한 분야에 적용됐다. 1950년대 이후 광범위하게 연구되고 활용되던 나이브 베이즈 기법도 인터넷의 발전에 따라 텍스트 분류, 이메일 스팸 필터링, 고객 세그멘테이션 등에 본격적으로 활용되기 시작했다. 

다양한 머신러닝 알고리즘들이 개발되며, 이들을 결합해 더욱 향상된 분류 및 예측 능력을 가진 알고리즘으로 만드는 앙상블(ensemble) 기법이 발전하기도 했다. 1997년의 에이다부스팅(Adaboosting)을 비롯한 다양한 부스팅 기법, 호 틴캄의 랜덤포레스트와 이를 개선해 현재 널리 사용되는 분류 및 회귀 트리(CART)와 같은 앙상블 기법이 개발된 것도 이 시기의 일이다.

AI 연구 흐름의 두번째는 응용 분야의 발전으로, 컴퓨터 비전, 자연어 처리, 로봇공학과 같은 기술적 분야뿐만 아니라, 게임, 금융 산업, 제조업 같은 일반인들이 직접 접할 수 있는 다양한 분야에서도 AI가 적용되기 시작했다. 얀 르쿤의 손글씨 숫자 인식 프로그램이 미국 우편국이나 수표 확인 시스템에 활용된 것이 이 시기이며, 마이크로소프트의 얼굴인식 프로그램, 구글의 이미지 검색 서비스도 시작됐다. 

뿐만 아니라 이 시기에는 보안, 감시, 의료 영상 분석, 광학 문자 인식 및 산업현장에서의 검사 및 품질 관리 시스템에 컴퓨터 비전이 본격적으로 활용되기 시작했고, AI 기법이 중요한 기술로 적용됐다. 또 인터넷의 발전에 따른 검색엔진 간의 경쟁으로 AI 기술을 활용한 정보 검색에서의 자연어 처리 기술 연구가 활발해졌고, 기계 번역 및 이메일 필터링으로도 그 활용 범위를 넓혀 나갔다. 

AI 연구의 초기인 1950년대부터 개발된 체커와 체스에서 AI가 인간을 완벽하게 이기고 은퇴한 것도 이 시기였다. 1990년 중반부터 인간 적수를 만나지 못한 체커 게임 치누크(Chinook)는 1996년에도 현격한 실력 격차를 확인하고 더 이상 입증할 것이 없다며 은퇴했고, 1997년에는 IBM의 딥블루가 인간 체스 챔피언을 꺾고 은퇴했다. 

체커와 체스 게임에 사용된 AI는 알고리즘 측면에서 볼 때는 새로운 기법이라기보다 초창기 연구부터 활용된 고전적인 머신러닝 기법 중심으로 개발됐다. 다만, 시스템적으로 전용 하드웨어를 구현해 탐색 속도를 높이고, 연산 능력을 극대화하는 방식으로 구현됐다. 

그러나 기업으로서는 이해하기 어려운 AI의 알고리즘보다는 좀 더 명확해 보이는 하드웨어적 진보로 인한 AI의 발전이 좀 더 안정감 있게 비쳤다. 딥블루와 다른 사례들을 통해 AI의 사업적 활용을 검토하던 기업에 하드웨어의 진보는 물론, 특히 이론적 근거가 명확해 보이는 통계학 기반의 AI 알고리즘의 결합은 충분히 매력이 있어 보였고, 사업적 투자에 충분한 명분을 줄 수 있었다.

대표적인 분야로 컴퓨터 게임을 들 수 있다. 스타크래프트나 헤일로와 같은 게임들은 역동적이고 도전적으로 진행하기 위해 게임 플레이어의 행동에 따라 상대 전략과 행동을 관리하는데 탐색, 의사결정트리, 유한 상태 머신 등 다양한 AI 기술을 활용했다. 

또 다른 사례로 신용 평가, 거래 전략 수립, 위험 관리, 의심 거래 식별과 주식 시장 예측에 AI 기술을 도입한 금융 분야를 들 수 있다. JP 모건의 거래 전략 실행 프로그램, 시티그룹의 신경망 거래 시스템, 찰스 슈왑과 피델리티의 자연어 처리 기반 분석 시스템과 고객 서비스 시스템은 금융 산업에 AI를 활용한 많은 사례 중 일부다. 또 여러 헤지펀드와 퀀트 트레이딩 회사가 주식 시장 예측을 위한 AI 기반 모델을 개발했는데, 시장 데이터와 뉴스 정서를 분석해 단기 가격 변동을 예측하고 거래 결정을 내리기 시작한 것도 이 시기의 일이다.              

이렇게 세기말 전후는 AI의 2차 겨울인지, 3차 부흥기인지 이론이 있지만, 통계학 기반의 머신러닝의 발전과 급격한 확산에 힘입어 AI가 본격적으로 현실과 산업에 적용되기 시작한 시기였다. 이때의 AI는 주로 SVM, 랜덤 포레스트를 포함한 통계학 기반의 머신러닝이 활용됐지만, 소수 연구자에 의해 신경망 머신러닝도 꾸준히 연구되고 있었다. 

특히, 신경망에 통계학 기반의 머신러닝이 결합되며 2000년대 중반 이후에는 딥러닝 연구에 폭발적인 발전을 가져다줄 수 있었다. 

문병성 싸이텍 이사 moonux@gmail.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지