마이클 사피엔자 투플랫폼 AI 총괄 (사진=투플랫폼)
마이클 사피엔자 투플랫폼 AI 총괄 (사진=투플랫폼)

“수트라(Sutra) 모델은 한국에서 우수한 성능을 발휘하며 MMLU 벤치마크 테스트에서 국내 기업들의 모델보다 높은 점수를 기록했습니다. 이미 많은 한국 대기업과 중견 기업들이 수트라 모델 도입을 고려, 파일럿 서비스를 계획하고 있습니다.“

마이클 사피엔자 투플랫폼 AI 총괄(Head of AI)은 대형언어모델(LLM) 수트라의 성능에 대해 강한 자신감을 보였다.

특히 AI의 지식과 문제해결 능력을 평가하는 MMLU에서 한국어 점수 67점으로, 54점을 받은 하이퍼 클로바X(HCX-003)보다 높다고 강조했다.

그는 “수트라는 개념 학습과 언어 학습을 분리해서 사용하는 새로운 다국어 LLM구조“라며 ”이 방식을 통해 50개 이상의 언어를 저비용으로 처리하고 다수의 다국어 벤치마크에서 우수한 성능을 증명했다“라고 밝혔다. 

이는 LLM 아키텍처를 개념 학습과 언어 학습을 나누고 토큰화 도구를 효율화하는 전략이다. 본질적인 언어 이해와 생성 능력을 높이는 것과 별개로, 다국어 말뭉치(corpus)를 학습함으로써 LLM의 다국어 능력을 향상하고 비용은 낮추는 것이다. 

“수트라는 언어별 모델의 확장 비용을 최소화하기 위해 개발됐다”라며 ”다국어에 대한 재교육과 미세조정 없이도 광범위한 언어를 지원할 수 있다“라고 설명했다.  

투플랫폼(대표 프라나브 미스트리)은 삼성전자 최연소 임원 출신이자 AI 분야의 스타과학자 프라나브 미스트리가 창업한 AI 스타트업이다. 지난 1월 AI 캐릭터와 소통할 수 있는 소셜앱 ‘재피(ZAPPY)’를 출시해 2개월 만에 25만명 이상의 유저를 모았다.

이어 3월에는 비영어권의 AI 활용을 돕기 위해 생성 AI 모델 수트라를 출시했다. 비영어권 언어에 대한 기존 LLM 성능이 낮다는 문제의식에서 출발했다.

현재는 50가지 이상 언어에서 텍스트 요약, 생성 등에서 뛰어난 성능을 보이고 있으며, 더 많은 언어로 확장 가능하다고 소개했다. 

한국어를 비롯해, 일본어, 스페인어, 프랑스어, 힌디어, 구자라트어, 벵골어 등을 지원하며, 이는 전 세계 인구의 절반 이상이 모국어 또는 제2 언어로 사용하는 언어다. 

그는 ”글로벌 비즈니스가 필요한 고객들에게 언어의 장벽없이 적절한 다국어 AI 솔루션을 제공할 수 있다“라고 자신했다. 

MMLU 벤치마크 테스트 결과 (사진=투플랫폼)
MMLU 벤치마크 테스트 결과 (사진=투플랫폼)

인도 최대 통신업체인 지오 플랫폼은 수트라를 활용해 다국어 고객지원, 음성비서, 검색 서비스를 제공하고 있다. 

“수트라는 지연시간이 짧고 비용 효율이 뛰어나 빠른 시간 안에 AI를 도입하고자 하는 기업에 적합하다”라며 “이미 몇몇 한국 기업들이 수트라의 도입을 고려하는 중”이라고 밝혔다. 

기업들의 다양한 요구사항에 맞춰 다양한 모델의 선택지를 제공한다. 수트라는 ▲복잡한 작업 처리에 탁월한 ‘프로(Pro)’와 ▲대규모 다국어 대화 처리에 최적화한 ‘라이트(Light)’ ▲신속한 애플리케이션에 적합한 ‘터보(turbo)’ ▲인터넷 지식을 활용해 최신 응답을 제공하는 ’온라인(online)’ 등이 있다. 

아울러 국내 기업 사용자를 위한 AI 학습과 ML옵스, API 개발까지 제공한다. 

그는 “한국에 ML옵스 전담팀과 개발 센터를 운영하고 있다”라고 말했다. 또 “여러 엔드포인트(통신 네트워크 노드)와 AI 서비스를 구축, 초저지연 및 비용 효율적인 AI 서비스를 제공한다“라고 덧붙였다. 

사피엔자 총괄은 “한국은 강력한 기술 산업과 뛰어난 디지털 리터러시를 갖춘 유망한 시장”이라며 “한국이 AI 시장을 선도할 수 있을 것”이라고 밝히기도 했다. 

박수빈 기자 sbin08@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지