인도에도 대형언어모델(LLM)이 등장했다. 인도의 다양한 언어와 문화를 반영, AI '챗봇' 형태로 먼저 배포될 예정이다.
블룸버그는 15일(현지시간) 인도의 인공지능(AI) 스타트업 크루트림 시 디자인스(Krutrim Si Designs)가 벵갈루루에서 행사를 열고 '크루트림'이라는 자체 모델을 공개했다고 보도했다.
이에 따르면 크루트림은 산스크리트어로 '인공'이라는 뜻이다. 지난 4월 설립된 이 회사는 인도 올라 그룹의 투자를 받았으며, 미국 샌프란시스코에도 연구팀을 두고 있다.
'인도 최초의 LLM'을 표방한 이 모델은 2조개 이상의 토큰으로 훈련된 오픈 소스 LLM이다. 기본형은 다음달 AI 챗봇 형태로 출시, 올라 그룹 택시 회사의 콜 센터에 우선 배치될 예정이다. 또 복잡한 문서를 파악하고 전문적인 문서를 생성하는 등 고급 기능을 갖춘 프로형은 내년 초 출시한다.
특히 크루트림은 20가지 인도 언어를 이해하고 이 중 힌디어, 칸나다어, 마라티어, 오디야, 텔루구어 등 10가지 언어로 콘텐츠를 생성할 수 있다는 설명이다.
또 인도어 능력에서는 'GPT-4'보다 뛰어나며, 다양한 벤치마크 결과 비슷한 크기의 오픈 소스 LLM보다 성능이 뛰어나다고 주장했다.
바비쉬 아가르왈 CEO는 시연 행사를 통해 영어로 손님을 환영하고, 타밀어로 시를 쓰고, 벵골어로 몬순에 대한 찬가를 작곡하고, 코드를 생성하는 모습을 선보였다. 그는 “전 세계적으로 유명한 AI 모델은 주로 영어로 훈련된다”라며 “그들은 인도의 문화와 정신, 언어를 이해하지 못한다”라고 강조했다.
또 이 회사는 데이터센터를 개발 중이며, 궁극적으로는 AI 생태계를 위한 서버와 슈퍼컴퓨터 구축을 목표로 하고 있다. 서버의 프로토타입은 내년 중반 출시 예정이며, 상용화는 2025년 말 가능할 것이라고 밝혔다. 칩렛 기술을 활용해 AI 칩 개발도 진행 중이라고 밝혔다.
이처럼 14억 인구의 인도에서도 LLM 개발이 본격화되고 있다. 크루트림의 발표에 앞서 주초에는 생성 AI 스타트업 사르밤(Sarvam)이 최초의 오픈 소스 힌디어 LLM인 '오픈하이티(OpenHaiti)'를 내놓았다.
이 회사는 인도계 미국인인 억만장자 비노드 코슬라로부터 4100만달러의 투자를 유치했으며, 기존 오픈 소스 모델을 활용해 오픈하이티를 구축한 것으로 알려졌다.
이전부터 인도에서는 챗봇에 대한 수요가 큰 것으로 알려졌다. 언어가 워낙 다양한 데다 문맹률도 높아, '챗GPT'를 활용한 음성 대화가 가능한 챗봇의 유용성이 뛰어나다는 소식도 들려왔다.
그러나 인도의 AI 산업 수준이 떨어지는 것은 아니다. 인도에는 애그리볼로(Agribolo)나 크로핀(Cropin)같은 농업 AI 전문부터 식음료 부문의 아이보노(Aibono)와 국방 분야의 아스테리아 에어로스페이스(Asteria Aerospace) 등 세계적인 AI 업체들이 포진해 있다.
임대준 기자 ydj@aitimes.com
