업스테이지(대표 김성훈)가 차세대 대형언어모델(LLM) ‘솔라 프로 2’를 공식 출시했다. 예고했던 대로, 추론 모드와 일반 모드를 혼합한 하이브리드 모델로, 최근 등장한 국내 모델 중 글로벌 모델에 가장 근접한 벤치마크 성적을 기록한 것이 특징이다.
업스테이지는 10일 솔라 프로 2를 출시했다고 발표했다. 이는 지난 5월20일 '프리뷰' 버전을 선보인 지 50여일만이다. 또 현재 홈페이지에서 데모 시연 및 사용 문의 접수를 진행 중이다.
솔라 프로 2는 단순 텍스트 생성 능력을 넘어, 논리적 사고를 기반으로 복잡한 문제를 해결할 수 있도록 설계된 추론 모델이다.
전작 ‘솔라 프로’와 비교했을 때 매개변수 규모를 220억(22B)에서 310억(31B)으로 확장해 성능을 크게 끌어올린 것이 특징이다.
또 하이브리드 모드 도입은 업스테이지 LLM 중 처음이다. 사용자는 빠른 응답에 최적화된 ‘챗 모드’와 단계적 사고를 통해 구조화된 답변을 생성하는 ‘추론 모드’를 상황에 따라 선택할 수 있다. 이중 ‘사고사슬(CoT)’ 기법을 적용한 추론 모드는 수학과 코딩처럼 복잡한 작업에서 성능 개선을 이끌어냈다는 설명이다.
이날 공개한 벤치마크는 지난 5월의 메타나 LG AI연구원, 네이버 등의 모델 비교를 넘어, 훨씬 규모가 큰 '딥시크-R1'과 오픈AI의 'o3-미니' 등을 포함했다.
그 결과 ‘종합지식(MMLU-프로)’ ‘수학(매스500, AIME)’ ‘코딩(SWE-벤치)’ 등에서 이들과 맞먹는 성적을 기록했다.
특히 비슷한 규모인 '큐원3-32B'와는 수학을 제외한 모든 분야에서 앞서거나 비슷한 수준을 기록했다. '미스트랄 스몰 3.2(24B)'는 전 분야에서 크게 앞섰다.
이는 최근 등장한 국내 모델 중 가장 글로벌 모델과 근접한 수치로 볼 수 있다.
한국어 성능은 당연히 두드러졌다. ‘인간 선호도(Arena-Hard-Auto)’ ‘해례(Hae-Rae)' ‘언어 이해력(Ko-MMLU)’ 등 주요 한국어 벤치마크에서 글로벌 모델을 뛰어넘었다.
업스테이지는 여기에 언어 이해를 넘어, 사용자 의도를 파악하고 외부 도구를 활용해 실행 가능한 결과물을 제공하는 ‘에이전트형 LLM’ 역할도 수행한다고 덧붙였다.
예를 들어, “최근 3개월간 경쟁사 신제품 출시 동향을 조사하고 관련 기사 링크를 포함한 PPT 초안을 작성해 줘”라는 요청을 입력하면, 실시간 웹 검색으로 데이터를 수집하고 이를 분석해 발표 자료까지 생성하는 과정을 모델이 정확히 계획 후 자율적으로 수행하는 방식이다.
김성훈 업스테이지 대표는 “솔라 프로 2는 단순히 말 잘하는 AI를 넘어, 문제를 이해하고 논리적으로 사고하며 실질적인 행동까지 수행하는 ‘AI 에이전트’ 시대의 차세대 언어모델”이라고 말했다.
또 “업스테이지는 자체 기술로 구현한 세계 최고 수준의 LLM을 기반으로, AI가 업무 방식을 근본적으로 혁신하고 나아가 ‘일의 미래’를 앞당길 수 있도록 지속적으로 기술을 발전시켜 나가겠다”라고 강조했다.
장세민 기자 semim99@aitimes.com
