한글과컴퓨터(대표 변정수, 김연수)는 글로벌 오픈소스 전문 듀얼랩과 ‘오픈 PDF 데이터 로더(Open PDF Data Loader)’의 공동 개발 및 사업 협력을 위한 양해각서(MOU)를 체결했다고 9일 밝혔다.
공동 개발하는 오픈 PDF 데이터 로더는 PDF 문서에서 데이터를 추출할 수 있도록 지원하는 소프트웨어 개발 도구(SDK)다.
한컴은 기업 문서에서 텍스트, 표, 이미지 등 객체를 추출하는 ‘한컴 데이터 로더’를 출시한 바 있다. 듀얼랩과 협력을 통해 듀얼랩의 PDF 데이터 추출 기술과 한컴의 AI 기술력을 결합해, PDF 문서에 특화된 오픈소스 버전을 내놓을 계획이다.
이후 PDF 데이터 추출 SDK는 누구나 자유롭게 사용할 수 있도록 공개하고, 광학문자인식(OCR)의 정밀도를 높이거나 표, 수식, 차트 등을 고도화된 AI 기술로 인식하는 기능은 별도의 상용 애드온 형태로 출시할 계획이다.
듀얼랩은 PDF 기술 표준을 관장하는 ‘PDF 협회’ 정회원이며, PDF/A 유효성 검사 도구인 ‘베라PF(veraPDF)’의 오픈소스 기술 개발을 주도해 왔다.
김연수 대표는 “이번 듀얼랩과의 협력은 한컴이 축적해 온 문서 기술력과 최신 AI, 오픈소스 트렌드를 결합해 글로벌 시장에 본격 진출하는 중요한 전환점”이라며 “단순한 제품 출시를 넘어 개방과 협력의 가치를 바탕으로 전 세계 개발자들과 함께 성장하는 기술 생태계를 구축하고, 이를 통해 한컴이 글로벌 AI 서비스 기업으로 도약하는 기반을 마련하겠라고 말했다.
박수빈 기자 sbin08@aitimes.com
