김성훈 대표가 사업 계획을 설명하고 있다. (사진=업스테이지)
김성훈 대표가 사업 계획을 설명하고 있다. (사진=업스테이지)

국내 대표 인공지능(AI) 스타트업 업스테이지가 연이어 신규 AI 모델을 출시, ‘도메인 특화 B2B AI 에이전트’를 구축하겠다고 밝혔다. 핵심은 강점인 광학 문자 인식(OCR)과 대표 모델 ‘솔라’를 결합, 강력한 멀티모달 기능으로 기업 문서 시장을 공략한다는 것이다. 

업스테이지(대표 김성훈)는 16일 여의도 콘래드 호텔에서 간담회를 개최, 사업 및 기술 개발 현황과 향후 계획을 발표했다.

김성훈 대표는 올해 다수의 모델을 출시하겠다고 전했다. 먼저, 이날 ‘솔라 프로 1.3’ 버전을 출시했다. 

업스테이지 모델 중 벤치마크 성능이 가장 높다고 강조했다. 기존 버전보다 구체적인 답변과 체계화에 능하다.

6월에는 ▲기존 220억(22B) 매개변수에서 330억(33B) 크기로 확장한 ‘솔라 프로 1.5’ 버전과 ▲‘사고 사슬(CoT)’을 구현한 첫 추론 모델 등을 공개할 예정이다. 

솔라 1.5는 1.3보다 ‘유창한 문장 구사력’에 초점을 두고 모델 콘셉트 프로토콜(MCP) 등을 지원하는 등 편리한 사용성에 초점을 둘 예정이다.

김 대표는 이들 모델 군에 대해 “범용 모델이 아닌, 산업별 특화 소형언어모델(sLM) 영역에서 독보적 기술 경쟁력을 갖추고 있다”라고 강조했다.

이어 OCR과 대형언어모델(LLM)을 통합한 멀티모달모델(LMM)로 확장에 나선다. 복잡한 레이아웃 인식에 강점을 보이는 OCR 모델 ‘다큐먼트 파스(DP)’와 대표 LLM 솔라를 결합한 비전언어모델(VLM) ‘솔라DocVLM’을 6월 공개한다. 

이 모델은 정보 요약과 질의응답, 보고서 작성 등 문서 기반의 다양한 작업에 능하다. 테스트 결과, 메타의 ‘라마 4 스카우트’나 구글의 ‘제미나이 2.5 프로’보다 정확도가 높았다고 주장했다. 

“LMM을 이용해 기업 문서 데이터를 처리할 경우, 100~1000페이지의 텍스트와 레이아웃까지 빠르게 처리할 수 있다”라며 “현장에서 사용하는 문서에 특화, B2B를 더욱 강화할 것”이라고 밝혔다.

특히, “B2B AI 모델은 범용 모델과 달리 명확한 목적과 수요를 가지고 있다”라며 “추론 모델의 경우 기업의 의사 결정을 지원하는 ‘AI 에이전트’로 작동할 것”이라고 말했다. 

김성훈 대표 (사진=업스테이지)
김성훈 대표 (사진=업스테이지)

실제 DP의 사용 문의가 급증한다고 전했다. 이에 5월에는 ‘워크스페이스’ 형태로 출시, 쉽게 성능을 경험해 볼 수 있도록 지원할 예정이다. 예를 들면, 문서 100장을 넣으면 시간대 별로 정리해 주는 등 작업을 대신 수행해 줄 수 있다는 것이다.

데이터에도 집중하고 있다고 밝혔다. 이활석 업스테이지 CTO는 “양질의 데이터가 필요한 추론 모델은 수학과 코딩 데이터 위주로 성능을 높이고 있다”라며 “실제 비즈니스에 도움이 될 수 있도록 추가 학습 데이터는 기업과 상담을 통해 결정하고 있다”라고 설명했다. 또 합법적이며 윤리적인 데이터 수집을 위해 기업 등과 제휴한다고 밝혔다. 

일본, 미국 법인을 두고 솔루션 현지화에 나서는 등 해외 사업도 활발히 전개 중이다. 특히, 일본에는 DP 경쟁 제품이 전무한 상태로, 일본의 문서 시장을 적극적으로 공략 중이라고 전했다.

이 외에도 중동과 협업을 논의 중이며, 최근 KT와 협업한 태국어 LLM 개발을 발판 삼아 동남아 진출도 본격화할 계획이다.

김성훈 업스테이지 대표는 “모델 개발에 집중하는 만큼 GPU 등 인프라 자금이 많이 소요된다”라며 “이에 글로벌 기업 등과 투자유치 등 자금 조달 건을 논의 중이며, 조만간 좋은 소식으로 이어질 것”이라고 덧붙였다.

장세민 기자 semim99@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지