국내 스타트업이 오랜만에 글로벌 대형언어모델(LLM) 리더보드에서 상위권에 진입했다. 지난해 시즌 2로 허깅페이스 리더보드가 개편된 이후, 톱 10을 기록한 것은 처음이다.
링크브릭스 자회사 링크브릭스 호라이즌AI는 24일 현재 허깅페이스 오픈LLM 리더보드에서 평균 47.34%의 정확도로 10위를 기록 중이다.
이 회사의 모델 'Saxo/Linkbricks-Horizon-AI-Avengers-V1-32B'는 '큐원(Qwen/Qwen2.5-32B-Instruct)'을 베이스로 미세조정한 모델이다.
GPU 'H100-80G' 8개를 이용, 35% 정도 매개변수에 감독미세조정(SFT) 및 직접선호최적화(DPO)를 거쳐 다국어 능력을 강화했다. 토크나이저는 단어 확장 없이 베이스 모델 그대로 사용했다.
특히 다양한 언어권을 기반으로 8000만건에 달하는 뉴스 및 위키 코퍼스를 이용했다. 작업별 일본어-한국어-중국어-영어 교차 학습 데이터와 수학 및 논리 판단 데이터를 통해 '언어 교차 증강 처리'와 '복잡한 논리 문제'에 대응할 수 있다고 강조했다.
또 고객 리뷰나 소셜 포스팅 등의 비정형 데이터 고차원 분석 및 코딩과 작문, 수학, 논리 판단 등을 강화한 것이 특징이다.
이 모델을 개발한 호라이즌AI는 지난 1월 '소형언어모델(sLM) 구축 플랫폼' 개발을 목표로 설립됐다. 데이터 사이언티스트인 지윤성 이사가 의장을 맡았다.
지윤성 이사는 지난해부터 언어모델 개발 도구 '호라이즌AI' 플랫폼을 통해 일본어 소형언어모델(sLM)을 개발했는데, 일본어 LLM 성능을 가리는 '오픈 JP-LLM 리더보드'에서도 상위권을 기록했다.
또, 국내 오픈 Ko-LLM 리더보드 시즌2에서도 지난해 11월 정상을 차지하는 등 국내는 물론 일본과 미국에서 모두 상위권을 휩쓸었다.
지윤성 이사는 24일 호라이즌AI를 ‘에이전트 개발 플랫폼’으로 확장했으며, 현재 개발을 마치고 출시를 앞두고 있다고 밝혔다.
그는 “LLM은 이미 포화 상태인 만큼, 이제는 기존 LLM을 잘 조합해 실용적인 서비스를 만드는 것이 업계 트렌드”라며 “호라이즌AI는 LLM의 추론 영역을 담당, 실제 서비스를 위한 도구로 자리 잡을 것”이라고 말했다.
특히 인공지능(AI) 에이전트를 쉽게 개발하도록 지원하는 것에 중점을 뒀다고 전했다. 이를 통해 여러 LLM을 활용, ‘딥 리서치’와 같은 도구를 제작할 수 있다는 설명이다.
실제로 사용자는 호라이즌AI에서 ‘드래그 앤드 드롭’만으로 LLM을 레고 블록처럼 조합, 에이전트 서비스를 만들어 낼 수 있다고 소개했다. 지윤성 이사는 “필요한 기능은 플랫폼 내 모두 구축돼 있기 때문에, 사용자는 조합만 하면 되는 방식”이라고 말했다.
번거로운 미세조정 없이도 애플리케이션을 제작할 수 있다는 설명이다. 관련 특허 3가지의 출원도 완료한 상태다. 완성한 애플리케이션은 키오스크나 로봇 등에 다양하게 적용이 가능하다.
한편, 국내 오픈 Ko-LLM 리더보드는 순위권 변동이 없는 상태다. 1위 점수는 55점대로, 50점을 기록하고 있는 글로벌 리더 보드와 점수 분포를 보이고 있다.
장세민 기자 semim99@aitimes.com
