Hierarchical 1,2 과제 대회 순위를 기록한 리더보드 순위표 (사진=업스테이지)
Hierarchical 1,2 과제 대회 순위를 기록한 리더보드 순위표 (사진=업스테이지)

업스테이지가 인공지능(AI) 광학문자인식(OCR) 국제 대회에서 4관왕을 차지했다. 

업스테이지(대표 김성훈)는 국제패턴인식협회(IAPR)가 21일 개최한 국제 경진 대회 ‘ICDAR 로버스트 리딩 컴페티션’에서 4종목(HierText-1/2, VQAonBD, IHTR) 1위에 올랐다고 24일 밝혔다.

ICDAR 로버스트 리딩 컴페티션은 디지털 이미지와 비디오에서 텍스트를 감지 및 인식하는 기술인 '로버스트 리딩(Robust Reading)' 분야의 권위 있는 국제 경진대회다. ICDAR는 문서 분석 및 인식 분야의 글로벌 기업 및 연구자들이 참여하는 국제 학회로, 1991년부터 매년 열리고 있다.

OCR은 이미지에서 ▲문자의 위치를 찾는 ‘검출 기술’과 ▲문자가 무엇인지 알아내는 ‘인식 기술’로 나뉜다. 업스테이지는 문자 검출 기술과 인식기술 모두에서 아마존과 엔비디아, 알리바바, 화웨이 등 빅테크들과의 경쟁에서 가장 높은 점수를 기록했다고 전했다.

인도에서 쓰이는 대표 10종의 언어 인식 문제를 다룬 IHTR 종목에서 업스테이지는 이전에 경험이 없던 신규 언어임에도 불구하고 모델을 구축, 1위에 올랐다고 설명했다.

특히 단어, 줄, 단락의 구조를 나타내는 계층적 주석을 제공하는 첫 번째 실제 이미지 데이터셋인 ‘HierText’를 사용, OCR의 새로운 작업을 수행하는 종목에서는 업스테이지 팀과 홍콩지사가 1위와 2위를 휩쓸었다.

단순 OCR기술만으로 좋은 평가를 받을 수 없는 VQAonBD 종목에서도 2위와 큰 점수 차로 앞섰다고 전했다. 이 종목은 문서 이미지를 주고 이미지 내 데이터의 답을 얻는 과제를 수행하는 종목으로, 예를 들면 계산이 복잡한 세금문서를 준 후 '2019년 세금 합계가 뭐야'와 같은 질문에 대해 답변을 추출하는 것뿐만 아니라 그 값을 이용해 비율이나 평균, 최소 최대 값 등을 구하는 연산 작업까지 수행하는 문제가 제시됐다.

이번에 입상한 업스테이지 팀은 국내 유일의 캐글대회 두자릿수 금메달 기록의 업스테이지 챌린지스 팀과 OCR팀이 뭉친 결과다. 챌린지스 팀에는 2021년과 2022년 연속으로 캐글 대회에서 세계 1위와 2위를 기록하며 국내 최연소 그랜드마스터에 이름을 올린 김윤수 엔지니어를 포함, 두명의 그랜드마스터와 한명의 마스터가 포함돼 있다. 또 현업에서 다양한 기업의 OCR 과제를 수행 중인 업스테이지의 연구원들이 힘을 합친 결과라고 강조했다.

업스테이지는 집중 연구를 통해 기존과 다른 새로운 방법론을 사용했다고 밝혔다. 기존 검출 기술은 인접한 단어 영역이 서로 겹치지 않도록 하기 위해 단어 영역을 크게 줄여 학습에 사용했다. 업스테이지 팀은 단어 영역은 적게 줄이는 대신 단어 영역 사이에 갭을 넣어 학습에 활용하면서 단어 상자를 예측하는 방식으로 모델 성능을 개선했다고 설명했다.

이를 통해 신설 평가 기준 중 하나인 '예측된 박스와 정답 박스 사이의 유사도'를 크게 향상할 수 있었다고 전했다.

업스테이지는 AI OCR 기술이 디지털 전환의 기반이 되는 핵심 AI 기술로, 데이터의 디지털 자산화를 위한 고도화에 여러 기업들이 속도를 내고 있다고 소개했다. OCR팩을 개발, 올 초 한화생명과 삼성SDS, 포스코그룹 등 다양한 산업의 기업의 AI 혁신에 앞장서고 있다고 덧붙였다.

OCR기술을 비롯, 고객 정보와 제품 및 서비스 특징을 고려한 추천 기술 등 AI 기술을 한 번에 맞춤형으로 활용할 수 있도록 돕는 노코드-로코드 솔루션 'AI팩'과 이를 코드 복사만으로 활용할 수 있는 API 시리즈를 서비스 중이다. AI팩을 이용하면 데이터 가공, AI 모델링, 지표 관리를 활용할 수 있다고 밝혔다.

김성훈 업스테이지 대표는 “AI OCR 분야 최고 권위의 대회에서 4개 부문 1위를 휩쓸며 다시 한번 글로벌 톱 AI 기술력을 인정받아 무척 기쁘다”라며 "세계 최고의 기술력이 검증된 업스테이지의 AI OCR로 문서 자동화가 필요한 전 산업의 디지털 전환과 AI 글로벌 혁신을 도울 것"이라고 말했다.

이주영 기자 juyoung09@aitimes.com

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지