(사진=오픈유로LLM)
(사진=오픈유로LLM)

유럽연합(EU)의 주요 인공지능(AI) 기업과 연구 기관이 모든 EU 언어를 포함하는 오픈 소스 대형언어모델(LLM) 개발을 위해 뭉쳤다. 지금까지 등장한 소버린 AI 프로젝트 중 가장 큰 규모로 평가된다.

핀란드 대표 AI 기업인 사일로 AI는 얀 하지치 프라하 찰스대학교 교수와 공동으로 20여개 기업 및 기관이 참여하는 '오픈유로LLM(OpenEuroLLM)' 프로젝트를 시작했다고 최근 발표했다.

이는 현재 24개의 공식 EU 언어와 EU 합류를 진행 중인 알바니아 등의 언어를 포함하는 소버린 AI 프로젝트다. 

사일로 AI는 지난해 4월 핀란드어와 아이슬란드어, 노르웨이어, 스웨덴어 등 북유럽 언어에 초점을 맞춘 LLM을 오픈 소스로 출시했으며 현재는 모든 유럽 언어를 포함하는 '유로파(Europa)' 모델을 준비 중이다. 또 하지치 교수는 몇년 전부터 LLM 개발을 위한 데이터셋 구축을 진행했다. 이들은 자연스럽게 프로젝트의 중심이 됐다.

모델 구축을 위해서 3740만유로(약 561억원)를 투입할 예정이며, 그 중 2000만유로(약 300억원)는 EU의 디지털 유럽 프로그램 지원금으로 충당한다.

빅테크의 모델 개발 비용보다 매우 적은 액수이지만, 이번 프로젝트는 스페인, 이탈리아, 핀란드, 네덜란드 등에 위치한 유로HPC 슈퍼컴퓨터 센터가 인프라를 제공한다. 따라서 실제 예산은 더 큰 규모라는 설명이다.

이번 프로젝트에는 독일의 대표 AI 스타트업 알레프 알파와 프랑스의 리이트온, 스페인의 프롬프트시트 등이 기업과 에인트호번대학교, 헬싱키대학교, 오슬로대학교, 투르쿠대학교, 튀빙겐대학교 등 유럽의 유명 AI 연구소가 대거 참여했다. 

하지치 교수는 프랑스의 간판 미스트랄 AI에도 참여를 요청했으나, 소용이 없었다고 밝혔다. 이 회사는 최근 프랑스 정부의 강력한 지원을 등에 업고 본격적인 사업 확장에 나서고 있다.

이번 프로젝트의 목표는 "유럽의 투명한 AI를 위한 일련의 기초 모델을 만드는 것"이다. "모든 EU 언어의 언어적 및 문화적 다양성을 보존해야 한다"라는 설명도 붙었다.

아직 매개변수 등을 결정하지는 않았지만, 학습용 디지털 소스 자체가 부족한 EU 일부 국가의 상황상 상당한 효과를 얻을 수 있다는 것을 강점으로 꼽았다.

LLM 첫번째 버전은 2026년 중반에 출시되고, 최종 버전은 2028년에 완성된다.

피터 살린 오픈유로LLM 기술 공동 책임자는 "우리는 챗봇이나 AI 어시스턴트를 만드는 것이 목적이 아니라, EU 기업들이 활용할 수 있는 AI 기반 모델을 구축하는 것"이라며 "우리는 모델을 만드는 데 필요한 것이 무엇인지 알고 있으며, 수십억달러가 필요한 것은 아니다"라고 말했다.

임대준 기자 ydj@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지