중국의 기술 대기업인 텐센트와 알리바바가 개발한 AI언어모델이 이해력 평가에서 인간을 앞섰다고 사우스차이나모닝포스트(SCMP)가 29일 보도했다.
평가에 사용된 프로그램은 클루(CLUE)라는 AI의 자연어 처리 능력을 측정하는 벤치마크 테스트로 3년전 중국 연구자들이 만든 도구다.
클루 웹사이트의 28일 순위에 따르면 텐센트가 만든 ‘훈위안 AI 모델’이 86.918점으로 1위를 차지했고, 알리바바의 ‘알리스마인드’가 86.685점으로 뒤를 이었다. 두 언어모델은 모두 인간의 86.678점 보다 높은 성적을 얻었으며 이 테스트에서 AI 모델이 인간을 앞선 것은 처음이라고 SCMP는 전했다.
텐센트와 알리바바의 모델 외에 중국 스마트폰 제조업체인 오포와 음식배달 대기업인 메이투안이 만든 언어모델이 4위와 5위를 차지했다. 알리바바 측은 이런 성과에 대해 “AI 언어모델의 중국어 이해가 새로운 수준에 도달했다는 의미”라고 평가했다.
중국의 기술 대기업들은 음성 지원 가상 비서나 기계 번역, 스팸 감지 등을 지원하는 자연어처리 기술을 개선하는데 공을 들여왔다. 중국 최대 인터넷 검색 기업인 바이두가 개발한 언어모델인 ‘두 시아오시아오’는 어렵기로 소문난 중국 국립대학 입학시험에서 대부분의 학생보다 높은 점수를 받은 글을 쓰기도 했다고 SCMP는 밝혔다.
그렇지만 대부분의 AI언어 모델들은 언어의 복잡성을 제대로 이해하기엔 아직 갈 길이 멀다고 일부 연구자들은 평가한다고 이 매체는 덧붙였다.
정병일 위원 jbi@aitimes.com
