로봇프로세스자동화(RPA) 전문 이든티앤에스(대표 김연기)는 인공지능(AI) 자동화 솔루션 ‘웍트로닉스’에 ‘닥 트랜스포머(Doc Transformer)’ 기능과 AI OCR 센터의 ‘잡스(Jobs)’ 기능을 새롭게 출시했다고 15일 밝혔다.
닥 트랜스포머는 딥러닝 기반 자연어 처리 기술을 통해 비정형 데이터인 문서에서 데이터를 추출해 XML 형태로 쉽게 정형 데이터를 제공하는 기능을 갖춘 기관 맞춤형 자동화 툴이다. 문서에 최적화된 학습 모델을 제공할 뿐만 아니라 각 기관의 시스템 업무 프로세스에 맞는 설정 및 학습, 추출, 예외 처리 기능을 제공한다.
한글 파일과 마이크로소프트 워드 파일의 비정형 데이터에서 문서 구조, 유사 문장, 유사도 등을 학습할 수 있으며, 문장 및 테이블에 대한 문서처리와 문단 순서 재처리와 오입력 수정 재처리 등 문서 보정 처리를 자동으로 진행해 문장 및 테이블 항목에 라벨링도 가능하다는 설명이다.
닥 트랜스포머는 국정원 보안 규정을 준수해 개발됐으며, 소프트웨어 자재명세서(SBOM)을 통해 보안 취약성을 사전에 제거해 공공기관 업무에서 사용되는 여러 데이터의 유실이나 외부 유출 우려를 차단할 수 있다고 전했다.
또 잡스는 광학문자인식(OCR) 추출 리뷰 페이지를 통한 인식 결과 확인 후 검증 및 수정, 재학습 기능을 지원한다. 사용자는 OCR을 통해 추출한 모든 문서에 대해 추가 비용 없이 검증 기능을 적용할 수 있다. 특히 필드별로 추출 결과와 원본 문서를 비교해 추출 결과가 정확한지 확인하고 수정 및 저장할 수 있다.
이든티앤에스는 닥 트랜스포머 기능 정식 출시 전, 세종 소재 공공기관의 데이터 개방 사업용 데이터베이스 구축에 이 기능을 성공적으로 적용한 바 있으며, AI OCR 센터 잡스 역시 기업 사용자에게 먼저 기능을 공개해 안정성과 실용성을 검증했다고 밝혔다.
김연기 이든티앤에스 대표는 "향후 업무 자동화 영역에서 AI 기술을 기반으로 지속적인 기술 및 제품 혁신을 추구하며 고객의 성공적인 디지털 전환을 지원할 것"이라고 말했다.
한편 이든티앤에스는 최근 NIA와 업스테이지가 운영 중인 ‘오픈-Ko LLM 리더보드'에서 ‘파인튜닝(Finetuning) 모델’ 분야 1위를 차지했다.
박수빈 기자 sbin08@aitimes.com
