"기업의 AI 도입이 늘어나며 데이터 자산화 수요도 많이 증가했습니다. OCR은 바로 이를 해결하는 핵심 기술입니다."
업스테이지(대표 김성훈)가 주력 사업인 대형언어모델(LLM) 수요 증가에 따라 광학문자인식(OCR)도 활성화되고 있다고 밝혔다. LLM 구축을 위해서는 데이터 구축이 우선으로, 여기에서 OCR의 역할이 강조된다는 설명이다.
이건찬 업스테이지 도큐먼트파스 사업개발 리드는 "최근 하루 평균 기업 두곳의 기업과 OCR 관련 미팅을 진행하고 있다"라며 "특히, 보험이나 물류뿐만 아니라 최근에는 건설 분야에서 수요가 급증하고 있다"라고 12일 밝혔다.
그는 "건설 공사 1건에서 발생하는 문서는 평균 5000~6000개에 달한다"라며 "입찰, 법률 등 세계 각국에서 건설사로 전달되는 문서를 모두 살펴보는 것 자체만으로 엄청난 시간이 소요될 수밖에 없다"라고 말했다.
이어 "건설이나 보험 분야는 문서의 포맷이 정해지지 않았을뿐더러 정보 유출에 더 조심스러운 경우가 많다"라며 "이때 OCR로 데이터를 추출, 독소조항 등 발견해야 하는 필수 정보를 검색 증강 생성(RAG) 기반으로 빠르게 검색할 수 있다"라고 설명했다.
이 때문에 업스테이지는 오픈 베타 웹사이트 ‘AI 스페이스(Space)’를 최근 오픈했다. 이는 다양한 형식의 문서나 문법, 문맥까지 식별할 수 있는 '도큐먼트 파스(Document Parse)' 모델을 기반으로 한다. 이를 통해 다양한 형식의 문서를 일원화된 데이터 체계로 구축해 준다.
"매일, 매시간 새로운 AI 모델이 출시되는 상황에서 고성능 AI 모델을 빠르게 적용하기 위해 기업이 할 일은 데이터 최적화일 수밖에 없다"라며 "실제로 비정형 문서 데이터를 AI에 학습하기 좋은 형태로 미리 준비해 두는 곳도 많아졌다"라고 전했다.
특히, OCR 기술은 문서를 단순히 읽어내는 것을 넘어 기업의 의사결정까지 바꿀 수 있다고 강조했다.
증권사 데이터의 경우, 복잡한 화면 안에서 어떤 데이터를 읽어내는지가 중요하다는 것이다. 수요에 맞게 데이터를 추출, 화면을 재구성하는 과정은 필수다.
또 "업스테이지는 '파서(Parser)' 모델만으로 문서 정보 추출이 가능하다"라며 "모델이 가벼운 만큼 가격 경쟁력도 갖췄다"라고 말했다.
여기에 회사가 LLM을 보유하는 등 '풀 파이프라인'을 갖추고 있다는 점을 강점으로 꼽았다. "최근 추론 하이브리드 모델 '솔라 프로2'가 출시되며 수요가 더 늘었다"라고 말했다.
OCR 기술은 개인에게도 유용하다고 전했다. 많은 자료를 업로드하고, 이를 용도에 맞는 형태로 출력할 수 있기 때문이다.
최근 인기를 끄는 구글의 노트북LM과 OCR 기능을 비교했다. 똑같이 관련 문서를 업로드하는 방식이지만, 도큐먼트 파스는 문서 요약을 넘어 문서의 어디에 어떤 정보가 있는지까지 찾아낼 수 있다.
이 때문에 AI 스페이스는 현재 액세스 신청자 대상으로 무료 오픈 베타 서비스 중이다.
해외에서의 성과도 두드러진다고 전했다. "미국 보험 업계에서도 많이 도입하며 가시적인 성과가 드러나고 있다"라고 말했다.
또 "일본은 문서 규모가 다른 국가에 비해 매우 큰 편"이라며 "문서량은 국내의 6~10배에 달하며, 특히 공공기관에 집중돼 있어 수요가 증가할 것으로 전망한다"라고 말했다.
업스테이지는 현재 비전언어모델(VLM)을 개발 중이라고 덧붙였다. 이는 파서보다 더 많은 정보의 해석이 필요할 때 유용하다.
그는 "문서 디지털화는 기업의 AI 도입을 위해 현재 가장 중요한 문제가 됐다"라며 "업스테이지는 기업의 지식 자산을 디지털로 전환, 일상 업무의 AGI 달성에 앞장설 것"이라고 강조했다.
장세민 기자 semim99@aitimes.com
