NLP 평가서 신기록 점수로 1위 차지
중-영 번역·챗봇 기능 구글보다 앞서

최근 자연어처리기법(NLP) 평가 결과 중국 최대 검색엔진 바이두가 구글보다 높은 점수를 받아 1위를 차지했다. (사진=wordpress.com). ©AI타임스
최근 자연어처리기법(NLP) 평가 결과 중국 최대 검색엔진 바이두가 구글보다 높은 점수를 받아 1위를 차지했다. (사진=wordpress.com). ©AI타임스

 

(AI타임스=박혜섭 기자) 중국 최대 검색 포털 사이트 바이두(Baidu)가 최근 미국 뉴욕대학과 워싱턴대학 연구진이 실시한 ‘자연언어처리 기법(NLP) 평가’에서 미국 IT 공룡기업 구글과 마이크로소프트(MS)를 누르고 1위를 차지했다. 

자연어 처리는 컴퓨터가 사람처럼 언어를 이해하고, 처리하며, 구사할 수 있도록 만드는 인공지능 기술이다. 이 기술은 포털 내 번역 기능과 챗봇에 쓰이고 있다.

MIT 테크놀로지 리뷰와 인디펜던트의 보도에 따르면 바이두의 NLP 기술은 최근 열린 ‘자연언어처리 기법(NLP) 평가’에서 유례 없는 90.1점을 차지하며 신기록을 세웠다. 구글과 MS는 각각 89.9점과 89.7점으로 2,3위에 이름을 올렸다.

바이두가 개발한 NLP 기술 이름은 '어니(ERNIE)2.0'이다. 지난 7월 기존 1.0 버전을 업그레이드 해 새로 출시한 이래 바이두 이용자는 물론 AI 전문가들 사이에서도 혁신적 기술이라 평가 받아 왔다. 바이두 측은 어니2.0이 중국어와 영어를 번역하는 데 있어 구글보다 더 뛰어난 성능을 지녔다며 자신있게 내놓았다. 바이두는 구글의 NLP 기술인 버트(BERT)를 염두해 기술명을 어니로 지었다. 어니와 버트 모두 미국 어린이 텔레비전 교육프로그램 ‘세서미 스트리트(Sesame Street)’ 캐릭터에서 착안했다.

어니2.0과 버트의 가장 큰 차이는 ‘중국어 해석 능력’이다. 어니2.0은 중국 내 주요 지방의 9개 사투리를 모두 이해해 완벽에 가깝게 영어로 번역해낸다. 이뿐 아니라 중국에서만 쓰는 간체와 대만·홍콩 등지에서 쓰는 번체를 섞어 문장을 입력해도 문제 없이 영어로 정확하게 해석할 수 있다.

문장의 구성 또한 풍성하다. 구글의 버트가 ‘간단한 접근법’이 강점이라면 바이두의 어니2.0은 사람이 쓴 다채로운 표현의 소설 속 긴 문장도 자연스러운 어감으로 번역한다. 어니2.0 개발팀은 이 과정을 성공시키기 위해 일반 도서 대신 해리포터 시리즈를 참고했다.

바이두의 뛰어난 챗봇 기술은 이미 세계적으로 정평이 나있다. 지난 2016년 의사와 환자 사이 진료를 돕는 챗봇 ‘멜로디’를 선보여 큰 화제를 낳은 바이두는 어니2.0을 기반으로 다양한 영역에서 쓰일 챗봇을 꾸준히 개발 중에 있다.

바이두 리서치 수석 설계자 하오 티안(Hao Tian)씨는 “모든 기술이 빠르고 간소화를 추구하는 4차산업혁명시대에 중국어는 복잡한 구조의 문자”라며 “바이두의 NLP 기술은 그러한 중국어를 완벽하게 이해하는 특화기술을 보유하고 있다”고 자평했다.

【에이아이타임스 aitimes 에이아이타임즈】

키워드 관련기사
  • "자연어처리(NLP)에도 버그 있다"...구글ㆍ아마존ㆍMS 클라우드서 발견