사이냅소프트(대표 전경헌)는 이미지 문서 내 텍스트를 인식 및 추출하는 OCR(광학문자인식) 솔루션 ‘사이냅 OCR 프로’ 업그레이드 버전을 출시했다고 22일 발표했다.
사이냅 OCR 프로는 이미지 속 문자뿐 아니라 표에 포함된 문자, 박스 체크 여부 등을 데이터로 바꿔주는 솔루션이다. 인공지능(AI) 딥러닝 기술로 정확도를 향상, PDF와 TIFF 등 이미지 파일의 문자 인식을 지원한다.
한국정보통신기술협회(TTA)에서 시행한 OCR 제품 품질성능평가에서는 공공행정문서 인식률 99%로 가장 높은 점수를 획득했다고 전했다.
업그레이드 버전에서는 비정형 서식 학습으로 키(Key)-밸류(Value) 추출을 지원하는 AI 운영 및 학습 도구 ‘키밸류 트레이너’를 제공한다. 트랜스포머 모델 기반 '의미 개체 인식(SER)' 기술을 활용, 비정형 서식에서 유의미한 정보를 인식한다. 딥러닝에 필요한 데이터 라벨링 및 학습, 평가, 배포, 운영 기능을 통합해 효율적인 GUI 딥러닝 관리 환경을 제공한다는설명이다.
비정형 서식 이미지 학습으로 정보 추출을 지원, 명함이나 영수증, 신용카드, 통장사본 등 문서를 처리할 수 있다. 문서 처리 작업을 자동화하는 RPA 등 활용성이 더욱 높아질 전망이라고 밝혔다. 사이냅 OCR 프로 사용자에는 키밸류 트레이너 기능을 무상으로 제공한다.
인식 품질과 서식 인식 기능, 표 인식 품질 등을 개선했다. 손글씨, 날짜, 주민등록번호, 전화번호 등 숫자 인식과 체크 박스 검출 품질을 비롯해 서식 내 서명 여부 검출 기능도 지원한다. 서식 인식 결과는 기존 csv 형태는 물론 엑셀 파일로도 제공한다.
전경헌 사이냅소프트 대표는 "내부 테스트 진행 결과 템플릿 서식 외에도 반정형, 비정형 서식에서 뛰어난 인식률을 보였다"며 "앞으로도 기능을 추가, 사용자에게 유용한 AI OCR 솔루션을 제공할 것"이라고 말했다.
한편 사이냅 OCR 프로는 최근 나라장터 디지털서비스 몰에 조달품목으로 공식 등록했다. GS 인증 1등급은 물론 조달 등록 완료를 통해 지방자치단체 및 공공 분야 디지털 문서 시장을 공략할 방침이다. 자세한 내용은 공식 제품 페이지에서 확인할 수 있다.
장세민 기자 semim99@aitimes.com
