■ 글자만 인식하는 OCR 시대는 끝났다. 이제는 맥락을 해석해야 한다
문서 자동화라고 하면, 여전히 많은 기업이 광학문자인식(OCR)으로 글자를 추출하거나 키워드를 뽑아내는 수준을 떠올린다.
그러나 실제로 문서가 업무에서 쓰이는 방식을 살펴보면, 단순히 텍스트만 뽑아내는 것으로는 충분하지 않다.
계약서에 적힌 조건과 수치, 보고서의 결론은 주변 맥락에서 의미가 있다. ‘승인’이라는 단어도 결재란 옆에 있으면 법적 효력을 갖지만, 본문 중간에 있으면 단순 언급일 뿐이다.
이제 인공지능(AI)에 필요한 것은 ‘글자를 인식하는 능력’이 아니라 문맥과 의도를 해석하는 능력이다. 문서의 위치, 배치, 사용된 표현이 어떤 의미를 전달하는지 이해하지 못하면 아무리 많은 데이터를 읽어도 실제 업무에는 적용되기 어렵다. OCR의 시대는 끝났고, 이제는 맥락을 이해하는 AI로의 전환이 요구되고 있다.
■ 문서 한 장이 아니라, ‘흐름 전체’를 읽어야 한다
업무는 단일 문서로 끝나지 않는다. 계약서 뒤에는 수차례의 회의록, 검토 의견, 결재 이력, 첨부 메일이 이어진다. 보고서 한 장만 봐서는 업무의 맥락을 알 수 없듯, 회의록 한 건도 단순 발언의 모음으로는 의미가 부족하다.
AI 기반의 업무 자동화를 이루기 위해서는 문서 간 관계와 흐름을 읽을 수 있어야 한다. 예를 들어, 프로젝트의 예산 축소 결정은 단순히 한 줄의 기록이 아니라, 사전 분석 보고서와 토론 과정, 이해관계자의 합의가 축적된 결과물이다.
AI가 문서 한 건만 처리하는 수준에 머문다면 의사결정의 본질을 담아낼 수 없다. 결국, 중요한 것은 문서를 개별적으로 인식하는 능력이 아니라 그 문서가 어떤 맥락 속에 놓여 있는지를 파악하는 능력이다.
■ 회의록 요약은 부족하다. ‘결론이 나온 과정’을 읽어야 한다
많은 기업이 최근 회의록 자동화, 음성 기록 요약 기능을 도입하고 있지만, 단순히 발언을 텍스트로 옮기거나 핵심 문장을 추출하는 것만으로는 회의의 본질적 가치를 담아내기 어렵다. 회의란 사실상 발언의 단순 집합이 아니라 특정한 맥락 안에서 다양한 이해관계자들이 의견을 주고받고, 그 과정에서 판단과 합의가 만들어지는 절차다.
따라서 AI가 회의록을 읽는 것은 단어를 정리하는 수준이 아니라 회의라는 사건이 어떤 필요로 시작됐는지, 어떤 배경과 자료를 근거로 진행됐는지, 최종적으로 어떤 액션 아이템이 도출됐는지를 복원해 내는 과정이다.
회의에서 “예산을 축소하기로 했다”라는 문장이 기록됐다고 가정하자. 이 결정은 단순한 문장이 아니다. 누가 축소를 제안했는지, 해당 제안이 어떤 수치와 분석에 근거했는지, 참석자들이 어떤 논쟁을 거쳐 합의했는지가 기록돼야 진정한 의미가 드러난다. 같은 ‘축소’라는 표현도 마케팅 비용을 줄이는 것인지, 인건비 조정을 의미하는 것인지에 따라 함의가 완전히 달라진다.
AI는 이런 차이를 놓치지 않고 맥락적으로 읽어내야 한다. 다시 말해, AI가 회의록을 읽는다는 것은 발언의 기록을 넘어서 판단과 합의의 역사를 재현하는 일이며, 이를 통해 회의라는 행위가 남기는 조직적 기억을 진정으로 보존하는 것이다.
■ 모두를 위한 범용 모델이 아닌, 기업별 맞춤형 모델이 답이다
AI가 진정으로 업무 자동화에 기여하기 위해서는 범용 모델만으로는 부족하다. 같은 업종 내에서도 기업마다 사용하는 문서의 양식, 용어, 표현 방식은 놀라울 정도로 다르다.
예를 들면, 한 회사의 계약서에서는 ‘총액’이라는 항목이 맨 위에 크게 강조됐지만, 다른 회사는 이를 부속 문서에만 기재하거나 ‘합계금액’이라는 용어로 대체해 사용한다. 또, 어떤 기관은 중요한 조건을 표 안의 작은 주석에 숨어 있게 두고, 다른 기관은 이를 본문 중간의 괄호 안에 기재하기도 한다.
이처럼 문서에는 각 조직만의 암묵적 규칙이 녹아 있다. 따라서 범용 서비스형소프트웨어(SaaS) 모델로는 일정 수준의 성능은 낼 수 있어도, 각 기업의 고유한 언어와 문법까지 해석하기는 어렵다.
진정한 자동화를 위해서는 기업별 맞춤형 모델이 필요하다. 현장의 실제 데이터를 반영하고, 업무 흐름을 학습해 해당 조직만의 표현과 의사결정 방식을 이해할 수 있어야 한다. 그래야 AI가 단순히 글자를 읽는 수준을 넘어, 그 기업의 업무 문법을 따르는 동료로 자리 잡을 수 있다.
■ AI가 문서를 ‘실행 단위’로 바꾸는 시대가 온다
보고서, 세금 계산서, 정책 제안서, 협조 공문, 프로젝트 계획서 등은 모두 구조화된 맥락의 저장소다. 과거에는 사람이 일일이 문서를 읽고 해석해야 했지만, 앞으로는 AI가 그 맥락을 해석해 사람에게 핵심만 전달할 것이다. 보고는 자동으로 요약되고, 의사결정자는 핵심 지표와 결론만 확인하면 된다. 반복되는 보고 체계와 승인 절차는 AI가 먼저 문서를 준비하고 연결하면서 효율성을 극대화하게 될 것이다.
이제 문서는 사람만을 위한 기록 도구가 아니다. AI가 문서를 매개로 업무를 이어받아 실행하는 단계로 들어가고 있다. 사람은 더 전략적이고 창의적인 판단에 집중할 수 있고, AI는 문서의 구조와 문법을 학습해 반복적이고 체계적인 부분을 담당한다.
결국 핵심은 하나다. AI가 문서를 ‘진짜로 이해할 수 있어야 한다’라는 것이다. 단순히 글자를 인식하는 수준을 넘어, 문서라는 형식의 문법을 AI에게 가르치는 시대가 도래한 것이다.
이것이 바로 문서 AI가 열어가는 새로운 질서이며, 앞으로의 업무 자동화가 도달해야 할 결정적인 전환점이다.
김지현 한국딥러닝 대표
