업스테이지가 ‘큐원’이나 ‘라마’보다 성능이 뛰어난 추론-비추론 하이브리드 모델을 개발했다. 하지만 추론 모델만 별도 출시할 계획은 없다고 밝혔다.
업스테이지(대표 김성훈)는 20일 차세대 대형언어모델(LLM) ‘솔라 프로 2’의 프리뷰 버전을 공개한다고 전했다.
솔라 프로 2는 지난해 12월 출시된 ‘솔라 프로’의 후속 모델로, 매개변수가 기존 220억(22B)에서 310억(31B)개로 확대됐다. 7월 정식 출시에 앞서 프리뷰 API를 초기 테스트용으로 사용할 수 있도록 무료로 공개했다.
특히, 업스테이지 LLM 최초로 ‘하이브리드 모드’를 적용한 것이 특징이다.
빠른 응답에 최적화된 ‘챗 모드’와 단계적 사고를 거쳐 구조화된 답변을 생성하는 ‘추론 모드’ 중 선택 사용이 가능하다. 추론 모드에는 ‘생각 사슬(CoT)’ 기법을 적용, 수학이나 코딩처럼 복잡한 문제에서 더 정교한 답변을 제공할 수 있게 됐다.
그러나 업스테이지 관계자는 “추론 모델을 별도 공개할 계획은 없다”라고 말했다.
켄텍스트 창은 기존보다 2배 확장됐다. 6만4000 토큰까지 지원, 더 긴 문서나 대화를 한 번에 처리할 수 있게 됐다. 또 자체 토크나이저 개선을 통해 한국어 및 문서 기반 작업에서 최대 30%까지 토큰 절감이 가능해져, 응답 속도와 비용 효율도 크게 향상했다고 전했다.
‘MMLU(종합 지식)’, ‘IFEval(지시 이행)’ 등 주요 LLM 벤치마크 성능에서 메타의 ‘라마 4 스카우트’는 물론 ‘라마 3.3 70B’, 알리바바의 ‘큐원 2.5 72B’ 등 매개변수 두배 이상의 빅테크 모델들을 앞질렀다고 전했다.
또 ‘KMMLU’, ‘해례(HAE-RAE)’ 등 한국어 성능을 평가하는 대표 벤치마크에서 높은 점수를 기록, 현재 공개된 소형언어모(sLM) 중 가장 뛰어난 수준이라고 덧붙였다. 주요 파트너사와 협업을 통해 고품질 한국어 데이터를 확보, 학습에 적극 활용한 것이 주효했다는 설명이다.
김성훈 업스테이지 대표는 “솔라 프로 2는 31B라는 효율적 규모로 70B 모델 수준의 성능을 구현해낸다”라며 “뛰어난 한국어 성능을 갖춘 이번 모델을 통해, 더 많은 업무 혁신을 기대한다”라고 말했다.
장세민 기자 semim99@aitimes.com
