솔트웨어(대표 이정근)는 대형언어모델(LLM) ‘사피(Sapie-gemma2-9B-IT)’가 미국 웨이트앤바이어스가 운영하는 ‘호랑이 리더보드’에서 오픈 소스 모델 분야 1위를 기록했다고 18일 밝혔다. 종합 순위는 3위에 랭크됐다.
호랑이 리더보드는 오픈 소스와 폐쇄형 모델 모두를 대상으로 한국어 능력을 평가하는 플랫폼으로, 지난 4월에 출시됐다.
솔트웨어는 매개변수 90억개(9B)인 구글의 '젬마'에 한국어 학습과 지시문학습(Instruction Tunning)을 수행해 사피를 구축했다고 설명했다. 특히 솔트웨어가 생산 가공한 데이터와 함께 학습용 데이터셋을 종합적으로 선별하고 번역과 정제 과정을 거쳐 양질의 데이터셋을 확보했다고 강조했다.
사피는 주어진 텍스트 안에서 사람, 조직, 날짜 등 주요 개체를 식별하고 분류하는 개체명 인식과 식별된 개체들 간의 관계를 추론하는 관계 추출을 종합하는 'EL(Entity Linking)' 지표에서 0.41점을 받았다. 또 제시된 단어를 활용해 문장을 만들어내는 능력 평가 지표 'FA(Fundamental Analysis)'에서 0.4836점을 받았다. 두 지표 모두 오픈 AI의 'GPT-4'와 앤트로픽의 '클로드-3 오퍼스'보다 높은 점수다.
GPT-4나 클로드보다 작은 크기라는 점을 감안하면 높은 한국어 이해와 추론, 생성 능력을 보여준 것이라고 강조했다. 이로 인해 제한된 컴퓨팅 환경에서도 높은 성능을 달성함으로써 사용자의 인프라 환경에 구애받지 않고 서비스를 가능하게 해준다고 전했다.
이번 리더보드 1위 달성으로 솔트웨어는 기업용 프라이빗 LLM 시장을 공략한다고 밝혔다. 보안 등의 문제로 클라우드 인프라 사용이 불가능한 기업의 경우 업무에 특화된 챗봇 서비스뿐만 아니라 생성형 AI 기반 추천 서비스 등으로 사업영역을 확대한다는 계획이다.
이정근 대표는 “솔트웨어의 모델 튜닝 기술력으로 멀티모달 모델의 기능을 확장하고, 이를 통해 구현 가능한 서비스의 범위를 넓혀 나감으로써 차별화된 경쟁력을 강화하겠다”라고 말했다.
박수빈 기자 sbin08@aitimes.com
