튜닙-일루더에이아이 지난 21일 협약 체결
비영어권 초거대 언어모델 개발 프로젝트
고현웅 튜닙 연구원 "한국어부터 개발 시작"

박규병 튜닙 대표. (사진=튜닙, 셔터스톡/편집=김미정 기자)

인공지능(AI) 기술 스타트업인 '튜닙'이 초거대 다국어 언어 모델의 효율적인 개발을 위해 AI 연구기관 '일루더에이아이(EleutherAI)'와 지난 21일 손잡았다. 영어권 이외 국가에서 접하기 어려운 초거대 언어모델 한계점을 극복하기 위해서다. 이를 위해 스타트업과 연구기관이 나선 셈이다. 양사는 앞으로 '초거대 다국어 언어모델링 프로젝트'를 시작한다고 밝혔다.

초거대 다국어 언어모델링 프로젝트는 일루더에이아이가 개발한 영어모델을 다양한 언어로 변환하는 프로젝트다. 기존 영어로 학습된 모델로 더 효율적이고 빠르게 새로운 언어 모델을 만들 수 있다.

해당 연구를 기획·운영하는 고현웅 튜닙 연구원은 "한 달 전부터 이번 프로젝트에 참여하고자 하는 국내 연구자를 모집했다"며 "약 50명이 동참했다"고 밝혔다. 그는 "가장 먼저 한국어를 목표로 개발 중이며, 빠르면 올해 상반기 내로 성과물을 보여주도록 하겠다"고 자신했다.

2020년 '오픈에이아이(OpenAI)'가 초거대 언어모델 'GPT-3'를 발표한 후, AI 연구와 산업은 모델 규모를 확장하기 위해 박차를 가하고 있다. 그러나 대다수 AI 연구기관이나 기업은 언어모델 규모 확장에 어려움을 겪었다. 막대한 자본이 들어서다. 대기업을 제외하면 AI 중소·스타트업에게 언어모델 확장은 거의 불가능한 일이었다.

이를 극복하기 위해 여러 연구자와 개발자들이 나섰다. 직접 초거대 언어모델을 만들어 대중에 무료로 공개했다. 이 과정에서 일루더에이아이 비영리 연구기관이 생겼다. 2020년 'GTP-Neo'에 이어 작년에는 'GPT-J', 올해는 'GPT-NeoX' 등 초거대 영어 언어모델을 순차적으로 공개했다. 

그러나 영어권 이외 국가에서는 여전히 초거대 언어모델에 접하기 어렵다. 영어를 제외한 다른 언어들은 초거대 언어모델에 여전히 큰 장애물이라는 의미다. 새로운 난제를 극복하기 위해 튜닙과 일루더에이아이가 다시 한번 나선 셈이다. 

튜닙은 다양한 페르소나를 가진 대화 모델을 만드는 스타트업이다. 특히 거대 언어 모델 기술력을 연구하고 다양한 커뮤니티와 이를 공유하고 있다. 작년에는 'Parallelformers'와 'OSLO'라는 병렬 처리 라이브러리를 오픈소스로 공개한 바 있다. 또 '마이크로소프트'나 '허킹페이스(Hugging Face)'등 해외 유수 기관도 관심을 보였다. 박규병 튜닙 대표는 "점점 그들만의 리그가 되고 있는 거대 언어 모델 개발 판도를 바꿀 수 있는 혁신적인 프로젝트가 될 것이다"고 밝혔다.

AI타임스 김미정 기자 kimj7521@aitimes.com

[관련 기사][박규병 칼럼] 인공지능 연구자/개발자가 되려면 어떻게 해야 할까?

[관련 기사]“인간보다 더 잘 본다”…픽셀까지 식별하는 AI

키워드 관련기사
  • 자원이 제한적인 환경에서 구동하는 머신러닝, TinyML
  • [찬이의 IT교실] AI 칩이 뭐길래… ① AI 칩 없이 AI도 없다
  • [AI 주간브리핑] AI 발전, 이제는 AI가 책임진다