김지현 대표 (사진=한국딥러닝)
김지현 대표 (사진=한국딥러닝)

■ AI 혁신…문서부터 못 읽으면 아무 의미 없다

기업의 모든 업무는 문서에서 시작한다. 계약서, 세금계산서, 영수증, 회의 메모, 검사 성적서까지. 하루에도 수십건, 많게는 수백의 문서가 생산되고 처리된다.

겉보기에는 PDF나 한글(HWP) 같은 디지털 파일 형태로 관리되는 것처럼 보이지만, 실제 현장을 들여다보면 여전히 종이 문서의 불편함이 그대로 옮겨져 있다. 도장은 이미지로만 남아 검색이 어렵고, 표는 그림처럼 삽입돼 데이터베이스로 활용할 수 없다.

게다가, 현장에서는 손글씨 기록이 중요한 근거 자료로 남는다. “디지털화됐다”라는 착각 속에 비정형 문서의 불편함은 사실상 줄지 않았다.

문서는 단순한 보조 기록이 아니다. 계약은 계약서에서 시작하고, 회계는 영수증과 세금계산서에서 출발하며, 인사 관리도 보고서와 평가 자료 위에 운영된다. 생산 관리 역시 검사 성적서와 작업 지시서가 없으면 돌아가지 않는다. 결국 문서를 읽지 못하면 업무의 진행이 끊길 수밖에 없다.

그런데 지금까지 기업은 문서를 단순한 첨부파일로 취급했고, 직원들은 수작업으로 복사해 엑셀에 옮기거나 전사적 자원 관리(ERP) 시스템에 입력해야 했다. 비효율이 반복된 것이다.

인공지능(AI)이 해당 영역을 가장 먼저 ‘혁신의 대상’으로 삼아야 하는 이유도 여기에 있다. 문서를 읽고 구조화한다는 것은 곧 기업의 일하는 방식을 이해한다는 뜻이고, 이는 모든 혁신의 출발점이다. 문서를 읽을 수 없는 AI는 결국 업무 전체를 이해하지 못하는 셈이며, 이는 디지털 전환의 근본 한계로 이어질 수밖에 없다

■ AI, 글자만 읽는다고 똑똑해지는 게 아니다

AI가 문서를 읽는다는 것은 단순히 글자를 추출하는 단계를 말하지 않는다. 같은 문장도 배치된 위치와 주변 맥락에 따라 전혀 다른 의미를 가진다. “검토 요청드립니다”라는 표현이 본문에 있으면 단순한 요청에 불과하지만, 결재란 옆에 쓰여 있으면 승인 절차와 직결된다. 옆에 도장이 찍혀 있다면 이는 단순한 장식이 아니라 승인 여부를 알려주는 핵심 단서다.

(사진=한국딥러닝)
(사진=한국딥러닝)

사람은 직관적으로 이를 구분하지만, AI는 구조적 맥락을 학습하지 않으면 알 수 없다. 그래서 최신 문서 AI는 단순히 텍스트를 추출하는 데 그치지 않고, 그 문장이 ‘표의 마지막 열’인지, ‘제목 아래 첫 문장’인지, ‘캡션 속 설명’인지까지 분석한다. 문서 이해는 글자 인식이 아니라 구조 인식에서 출발한다.

실제 한국딥러닝의 ‘딥 파서(DEEP Parser)’는 이러한 구조 이해를 기반으로 문서를 대형언어모델(LLM) 학습용 데이터로 전환해 준다. 한 금융기관은 수천건의 계약서와 보고서를 파서로 처리해 표-목차-캡션을 자동 구조화, 이를 HTML과 제이슨(JSON) 포맷으로 변환했다. 그 결과 1건당 20분 이상 소요되던 데이터 라벨링 과정을 1분 이내로 줄일 수 있었고, 정합성 높은 학습 데이터셋을 빠르게 확보할 수 있었다. 

또 다른 데이터 레이블링 전문 기업은 형식이 제각각인 보험 약관과 민원 문서를 파서로 변환, AI가 이해하기 어려운 비정형 텍스트와 이미지를 LLM 학습 친화적 구조 데이터로 정리하며 수작업 비용을 70% 이상 절감했다.

이처럼 구조적 이해가 쌓이면 단순 텍스트 추출을 넘어 문서는 곧 AI 학습을 위한 자산이 된다. 요약, 분류, ERP 자동 입력뿐만 아니라, 보고서 작성과 계약 검토, 리스크 탐지까지 확장할 수 있는 기반이 마련되는 것이다. 딥 파서는 단순 문서 처리 도구가 아니라 AI 학습 파이프라인 전체를 혁신하는 출발점이 되고 있다.

■ 양식 천차만별, 이제는 변명이 되지 않는다

많은 기업이 자동화를 시도하다가 멈춘 이유는 늘 같았다. “우리 문서는 제각각이라 불가능하다.”

과거에는 사실이었다. 부서마다 다른 양식, 협력사마다 다른 포맷은 시스템의 오류를 불러왔다. 초기 자동화는 양식 기반으로 접근했지만, 변화가 잦은 현장에서는 유지될 수 없었다. 현실의 문서는 언제나 일정하지 않기 때문이다.

(사진=한국딥러닝)
(사진=한국딥러닝)

하지만 지금은 다르다. 최신 AI는 위치나 모양에 종속되지 않는다. 어떤 영수증은 합계 금액이 오른쪽 아래에, 다른 문서에서는 왼쪽 가운데에 있어도, AI는 맥락과 구조를 통해 합계를 알아낼 수 있다. 계약서 역시 형식은 제각각이지만, AI는 본문 패턴과 문단 구조를 읽어 ‘계약 기간’ ‘책임 범위’ ‘위약 조항’을 추출한다.

즉, 이제는 문서를 표준화할 필요가 없다. 핵심은 문서를 바꾸는 게 아니라 어떤 문서든 의미를 해석할 수 있는 AI라는 것이다. 과거에는 기업이 문서를 시스템에 맞췄다면, 이제는 AI가 문서를 현실에 맞춰 읽어야 한다.

■ 문서를 바꾸지 말라, AI가 바뀌어야 한다

그동안 시스템 설계의 기준은 “사람이 쓰기 편한 문서”였다. 그러나 이제는 “AI가 읽을 수 있는 문서인가”라는 질문으로 전환되고 있다. 그렇다고 모든 문서를 AI 친화적으로 다시 설계해야 하는 건 아니다. 현실에서 쓰이는 문서는 언제나 불완전하고, 제각각이며, 때로는 비정형적이다.

결재란이 이미지로만 남아 있어도, 표가 그림 형태로 삽입돼 있어도, 손글씨가 섞여 있어도 AI는 이를 인식하고 구조화해야 한다. 업무 혁신의 본질은 문서를 바꾸는 게 아니라, AI가 어떤 문서든 읽을 수 있는 능력을 갖추는 것이다.

이는 단순 기술의 문제가 아니다. 문서가 변화무쌍하기 때문에, 결국 조직은 ‘문서를 표준화’하려 애쓸 것이 아니라 ‘AI가 문서를 이해하도록 만드는’ 방향으로 투자해야 한다. 이 과정은 기업의 IT 투자 방식에도 변화를 요구한다. 시스템 재설계보다 더 중요한 것은 AI 학습 기반과 데이터 해석 능력을 확보하는 일이다.

■ AI 혁신은 챗봇이 아니라 문서를 읽는 데서 갈린다

많은 기업이 챗봇이나 생성 AI로 고객 대응을 혁신하려 하지만, 가장 빠른 성과는 문서 자동화에서 나타난다. 이유는 간단하다. 모든 부서가 문서를 중심으로 일하기 때문이다.

회계팀은 영수증과 전표를, 인사팀은 계약서와 보고서를, 생산팀은 검사 성적서와 작업지시서를 매일 다룬다. 영업팀은 견적서와 발주서를 통해 고객과 거래한다. 이 문서들이 구조화되는 순간, 업무는 훨씬 빨라지고 정확해진다. 직원들은 반복 입력에서 해방돼 더 중요한 판단과 창의적 업무에 집중할 수 있다.

실제 사례가 이를 증명한다. 국내 대형 투자기관은 한국딥러닝의 ‘딥 OCR+’를 도입해 9000건 이상의 법인등기부등본을 AI 문서 에이전트로 처리했다. 평균 30분 걸리던 작업이 5초로 단축됐고, 오류율은 98% 줄었으며, 처리량은 15배 이상 늘었다. 

또 다른 제조 대기업은 제각각인 검사 성적서와 작업 지시서를 AI로 구조화해 ERP와 연동, 품질 관리 효율을 크게 높였다. 이 과정에서 바뀐 건 문서가 아니라 AI였다. AI가 어떤 문서든 읽어낼 수 있었기에 가능한 혁신이었다. 그리고 이 경험은 다른 부서와 조직으로 빠르게 확산된다. 작은 성공이 조직 전체의 신뢰를 이끌어내며, AI는 단순한 툴이 아니라 업무 파트너로 자리 잡게 되는 것이다.

■ AI, 이제는 부하 직원이 아니라 옆자리 동료다

AI는 이제 단순 보조 기능을 넘어섰다. 문서를 열고 내용을 이해하며, 조항을 검토하고, 조건을 판단해 결재 기준에 부합하는지를 확인한다. 필요하면 상신하고, 부적합하면 보류 사유를 정리한다. 이는 단순 자동화가 아니라 맥락을 읽고 판단하는 수준의 업무다.

이때 중요한 건 문서를 표준화하는 일이 아니다. 다양한 문서를 그대로 받아들이고, 해석할 수 있는 AI의 이해력이다. 조직은 이제 AI를 단순한 도구가 아니라 새로운 동료로 받아들여야 한다. 그 출발점이 바로 “AI가 어떤 문서든 읽는다”는 전제다.

결국 이는 기술 도입의 문제가 아니라, 조직 문화의 재편 과정이다. 사람과 AI가 읽고 판단하는 시스템으로 전환될 때, AI는 더 이상 실험이 아닌 실질적 동료가 된다.

■ 문서를 바꾸는 것이 아니라, AI가 ‘알아서’ 읽어야 한다

AI 혁신의 출발점은 언제나 문서다. 그러나 이제 그 방향은 달라졌다. 더 이상 모든 문서를 표준화하거나 재설계하려 애쓸 필요가 없다. 현실의 문서는 제각각이고, 불완전하며, 때로는 복잡하다. 중요한 것은 이런 문서를 그대로 받아들이고, 있는 그대로 읽고 이해할 수 있는 AI의 능력이다.

문서의 형식과 구조가 다 달라도 결국 업무는 여기서 출발한다. 따라서 AI가 문서를 읽는 능력 자체가 곧 기업 경쟁력으로 직결된다. 오늘날 기업의 디지털 전환이 성공하는가 실패하는가는, 얼마나 많은 문서를 AI가 스스로 해석하고 구조화할 수 있는가에 달려 있다.

업무 혁신은 문서를 바꾸는 데서가 아니라, 문서를 읽을 수 있는 AI에서 시작된다. 이것이야말로 기업이 AI 시대에 진정한 생산성을 확보하는 길이다. 앞으로 살아남는 조직은 문서를 AI가 대신 읽게 하고, 그 위에서 더 빠른 판단과 더 나은 결정을 내리는 조직일 것이다. 문서를 읽는 AI를 가진 기업과 그렇지 못한 기업의 격차는 시간이 갈수록 벌어질 수밖에 없다.

김지현 한국딥러닝 대표

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지