인공지능(AI) 전문 플리토(대표 이정수)는 자연어처리 전문 트위그팜(대표 백선호)과 함께 AI 번역기 품질 평가를 위한 데이터를 공동 구축한다고 7일 밝혔다.
이번 사업은 트위그팜이 주관사인 한국지능정보사회진흥원(NIA)의 ‘다국어 번역 품질 평가 데이터’ 사업에 플리토, 시스트란, 글나무, 에퀴코리아, 푸르모디티 등 총 5개사 컨소시엄이 협약을 체결한 데 따른 것이다.
컨소시엄은 올 연말까지 ▲언어별 저작권 이슈 없는 신규 문서 확보 ▲언어별 번역 말뭉치 데이터 및 번역 품질 평가 데이터 구축 ▲데이터 및 구축 공정 품질관리 및 데이터 품질 검증 수행을 통한 고품질 데이터셋 구축 등을 수행할 계획이다.
트위그팜은 고품질의 대규모 병렬 말뭉치(코퍼스) 데이터를 구축하기 위해 통합 크라우드소스 플랫폼을 운영하는 플리토와 손잡았다고 밝혔다. 전 세계 약 1300만 유저의 플랫폼을 통해 양질의 최신 언어 데이터 확보가 가능하고, 저작권 문제없는 적법성이 확보된 데이터 구축이 가능하다는 점에서 최적의 파트너라는 설명이다.
플리토는 자체 AI 엔진과 플랫폼 번역가, 검증된 링귀스트팀을 모두 운영하면서 ‘국립국어원 한국어-외국어 병렬 말뭉치 구축 사업’을 3년 연속 수주한 바 있다.
백선호 트위그팜 대표는 “지금까지 정부 주도의 대규모 말뭉치 데이터 구축을 지속하고 있었지만, 정작 데이터의 품질을 평가하는 기술에는 다소 한계가 있었다”라며 “초고품질 다국어 데이터 구축 및 품질 평가를 통해 초거대 AI 환경 조성에 기여하겠다”고 말했다.
이정수 플리토 대표는 “이번 수행 과제에 글로벌 통합 플랫폼을 활용할 수 있게 돼 기쁘다"며 "저작권 이슈 없는 고품질 다국어 데이터 구축에 차별적 경쟁력을 보유하고 있는 만큼 사업의 성공적 완수를 위해 최선을 다하겠다”고 말했다.
이주영 기자 juyoung09@aitimes.com
