업스테이지가 지난 11일 오픈소스로 공개한 ‘솔라 프로(Solar Pro)’의 초기 테스트용 모델 ‘솔라 프로 프리뷰(Solar Pro Preview)’ 버전이 허깅페이스 오픈 LLM 리더보드에서 1위를 차지했다. 오픈 소스 모델 성능 1위에 오른 것은 지난해 8월 이후 1년여만이다.
업스테이지는(대표 김성훈)는 솔라 프로 프리뷰 모델이 출시 직후 오픈 LLM 리더보드에서 매개변수 70B 미만 기준 1위를 달성했다고 19일 밝혔다.
현재는 매개변수 70B 미만 모델 기준 3위, 전체 15위를 기록하고 있다.
특히 글로벌 리더보드가 시즌2로 개편한 이후 벤치마크 난이도가 대폭 높아진 것을 감안하면 놀라운 성과라는 분석이다. 220억(22B) 매개변수만으로 평균 점수 39.61을 기록, 대형언어모델(LLM)에 버금 가는 성능을 보여주고 있다.
아직 테스트 버전이라는 것을 고려하면, 향후 성능이 더 고도화할 전망이다.
업스테이지 관계자는 "우리가 만든 최신 모델이 다시 한 번 글로벌 리더보드에서 세계적인 수준을 입증하게 돼서 기쁘다"라며 "특히 솔라 프로는 LLM의 감성 지능과 고급 추론 능력을 평가하는 EQ 벤치와 MAGI-Hard 평가에서 'GPT-4o 미니'보다 우수한 성능을 기록, 처음으로 GPT-4 제품군을 능가하기도 했다"라고 말했다.
이어 "이로써 업스테이지 솔라는 경량 언어모델 중에서는 국내뿐만 아니라 빅테크와 비교해서도 독보적인 위치를 다지고 있다"라고 강조했다.
한편, 업스테이지는 지난해 8월 허깅페이스의 오픈 소스 LLM 리더보드에서 1위를 차지한 바 있다. 이어 솔라는 올해 초 미세조정 버전으로 많은 개발자들이 활용, 허깅페이스 리더보그 1~10위를 휩쓴 바 있다.
EQ 벤치와 글로벌 리더보드는 각각 해당 웹사이트에서 확인할 수 있다.
장세민 기자 semim99@aitimes.com
- 업스테이지, LLM '솔라 프로' 프리뷰 공개..."11월 정식 출시"
- 업스테이지, 의료 LLM 시장 진출...카카오헬스케어와 디지털 헬스케어 사업 협력
- 티쓰리큐-업스테이지, AI 사업 파트너십 체결..."솔라에 RAG 연동"
- 베슬AI-업스테이지, 글로벌 시장 공략 위한 MOU 체결
- 업스테이지, 43개국 참여 글로벌 해커톤 ‘AI 위크’서 최우수 5팀 선정
- [10월1주] 개편 이전 강자들 상위권 재진출...479개 모델 평가 완료
- 아하-업스테이지, 한국어 코퍼스 데이터 공급 계약 체결
- 업스테이지, 업그레이드 OCR 모델 ‘도큐먼트 파스’ 공개…"빅테크 모델 능가"
- 업스테이지 “기업에 필요한 기술은 멀티모달 아닌 풀스택 LLM”
