(사진=셔터스톡).
(사진=셔터스톡).

마이크로소프트(MS)가 뉘앙스 커뮤니케이션즈(뉘앙스)를 197억달러(약 22조 1200억원)에 인수한 가운데 자연어처리(NLP) 기술을 향한 관심이 더욱 높아지고 있다.

뉘앙스는 AI 기반 음성인식 개발업체로, 애플의 시리 개발에 참여한 독자적 기술을 보유한 기업이기 때문이다. 업계 전문가들은 MS가 애플, 구글, 아마존과의 경쟁에서 선도하기 위한 방법으로 뉘앙스를 선택했다고 보고 있다.

NLP기술은 몇 년사이 보편적인 기술이 됐다. 글로벌 시장조사기관 가트너는 오는 2025년 화이트칼라(사무직·지식 노동자) 가운데 50%가 NLP 기술을 도입해 사용할 것이라고 전망했다. 지난해에는 5% 뿐이었다. 약 4년 후 노동계층 절반이 NLP를 쓸 것으로 예측되는 만큼 그 시장은 큰 폭으로 성장 중이다.

이러한 가운데 월스트리트저널(WSJ)은 최근 NLP 기술 개발 과정을 다음과 같이 요약했다.

NLP의 유래

NLP 개발 시작은 1950년으로 거슬러 올라간다. 뉴욕대 쿠란트 수학연구소의 마이클 피케니 교수는 NLP 선구자로 언어학자 노엄 촘스키 교수와 존 맥카시 프린스턴대 수학과 교수를 꼽았다.

동의어 계산법은 확률에 근거

오늘날 NLP는 단어 앞뒤를 구조적으로 나열한 뒤 어떻게 해석돼야 하는지 그 확률을 계산한다. 예를 들어 ‘클럽(Club)’이라는 단어가 샌드위치일지, 골프채일지, 밤 문화생활을 의미하는지 정확히 이해하려면 문장 앞뒤 단어를 먼저 이해하는 방식이다.

신경망(Neural Network)에 입성하다

피케니 교수에 따르면 초기 NLP 개발은 컴퓨터가 언어를 이해하는 방식에서 ‘하드코팅된 소프트웨어 규칙’이 존재했다. 그러나 2010년대부터 신경망 발전과 함께 NLP 개발도 가속화를 달리기 시작했다. 신경망은 인간이 뇌 운동을 통해 문제를 해결하는 방법을 모방한 알고리즘이다. 이제 신경망은 안면인식 시스템부터 딥러닝을 비롯한 AI에 동력을 공급하는 주요 기술로 자리잡았다.

(사진=셔터스톡).
(사진=셔터스톡).

NLP는 “나는 강을 건너 둑으로 갔다”와 “나는 길을 건너 둑으로 갔다”라는 목적은 같지만 과정이 다른 문장을 반복적으로 훈련하면서 어떤 강을 건넜는지, 어떤 길을 건넜는지, 최종적으로 둑에 도착하려면 강과 길 중 가까운 경로가 어디인지까지 ‘확률적 가정’을 내릴 수 있다.

앞으로의 당면과제

포레스터 리서치의 이안 제이콥스 애널리스트는 “재사용 중인 NLP 시스템은 매우 특정 용도에 맞게 설계됐다”며 “이러한 시스템 성능이 해당 영역 밖에서 발생할 경우 그 성능이 저하될 수 가능성에 대해서도 고려해야 한다”고 강조했다.

예를 들어 챗봇 사용자가 항공편 예약 시 항공편과 시간에는 정확한 대답을 하다가도, 리워드 포인트나 환불에 대해 질문하면 대답에 어려움을 겪을 수 있다는 것이다.

제이콥스는 “사용자 경험에 영향을 미칠 수 있는 단어와 어조의 선택에서 자연스러운 반응을 전달하도록 NLP 시스템을 훈련시키는 것은 상당히 어려운 과정”이라고 말했다.

현재 NLP는 단어를 나열한 문장만이 아닌, 말하는 사람의 억양과 목소리까지 분석해 상황에 따라 달라지는 감정까지 인식하는 단계로까지 진화하기 위해 달려가고 있다.

AI타임스 박혜섭 기자 phs@aitimes.com

 

[관련기사] MS의 AI 음성인식 기업 뉘앙스 인수?..."한국엔 셀바스AI가 있다"

[관련기사] 2021년 최고의 머신러닝 플랫폼 TOP 10

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지