(사진=로민)
(사진=로민)

문서 인공지능(AI) 전문 로민(대표 강지홍)은 AI 기반 고성능 문서 데이터 처리 솔루션 ‘텍스트스코프 Doc 파서(Textscope Doc Parser)’를 출시했다고 16일 밝혔다.

텍스트스코프 Doc 파서는 다양한 형식의 문서에서 글자, 그림, 표 등을 추출하고 읽기 쉬운 포맷으로 변환, 대형언어모델(LLM) 기반 비즈니스 애플리케이션 활용을 지원하는 문서 데이터 처리 솔루션이다.

파서는 문서 파싱 기능으로 ▲10종 이상의 레이아웃 요소 인식 ▲자연스러운 읽기 순서 유지 ▲폰트 크기∙이미지 크기 및 위치 인식 ▲그림, 표 캡션 관계 인식이 가능하다.

AI OCR 기반 이미지 파일 인식 기능으로 저화질 이미지, 복잡한 표구조, 필기체 등 서식의 다양성과 변동성에 관계없이 정확하게 데이터를 인식하고 추출하며 다양한 입출력 파일 포맷을 지원한다.

RAG에 활용되는 벡터 임베딩(Vector Embedding)을 위한 데이터 연계 기능 및 LLM 성능 개선을 위한 프롬프트 맞춤형 데이터 형식을 제공한다. 기업 사용자들은 LLM의 정확도를 높이기 위해 RAG를 적용할 때 내부 문서를 쉽게 벡터 데이터로 변환할 수 있다.

강지홍 로민 대표는 “로민의 도큐먼트 AI 기술력을 활용한 이 제품은 원본 문서를 기업에서 활용할 수 있는 가장 최상의상태로 변환해 주는 솔루션”이라며 “고객이 정확한 데이터 분석을 통해 더욱 현명한 의사결정을 내리는 데 도움이 될 것으로 기대한다”라고 말했다.

박수빈 기자 sbin08@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지