(출처=서울디지털재단, 셔터스톡, 편집=조희연 기자)
(출처=서울디지털재단, 셔터스톡, 편집=조희연 기자)

9일 서울디지털재단이 주최한 제2차 서울 데이터 행정 포럼에서 데이터분석 전문업체 한빛파트너스 김재현 대표는 미래를 예측하기 위한 '데이터 거버넌스' 구축을 강조했다.

국회에 통과된 '데이터기반행정법'은 오늘부터 시행된다. 10일 공공분야의 인프라를 연결하는 '데이터통합관리 플랫폼' 구축을 시작했다. 플랫폼이 구축되면 공공 현장 빅데이터를 분석해 AI로 미래를 예측할 수 있는 가장 기본적인 환경이 마련될 예정이다.

데이터기반행정법은 기본적으로 "공공기관 간 데이터 요청 시 제공을 의무화하겠다"는 조항과 "정부통합데이터분석센터를 설치해 데이터통합관리플랫폼을 구축한다"는 내용을 담고 있다.

데이터 분석 목적 3가지

데이터는 과거의 자료를 토대로 분석한다. 데이터 분석 목적은 크게 ▲원인분석 ▲현상분석 ▲미래예측분석으로 나눌 수 있다.

'원인분석'은 과거 데이터를 분석해 이미 발생한 목표값에 대한 원인을 찾아내는 것을 말한다. '현상분석'은 원인분석에 대한 결과를 확인해 나타난 현상이 어떤 것인지를 정확히 파악하는 것을 의미한다. 이 두가지를 합쳐 '패턴분석'이라고 부르며, 비교적 추론하기 용이한 데이터 분석으로 취급한다.

하지만 김 대표는 "마지막 '미래예측분석'은 미래에 대한 데이터가 없기 때문에 과거 데이터를 분석할시 어려움이 있다"며, "미래와 가장 가까운 데이터가 있어야 미래 예측에 대한 정확도를 높일 수 있다"고 덧붙였다. 하지만 그러려면 기본적으로 굉장히 많은 양의 데이터가 필요하다고 강조했다.

빅데이터 분석 vs 데이터 분석

빅데이터와 데이터 모두 분석하는 데 사용되는 기술은 동일하다. 하지만 단순히 데이터 양이 많다고 해서 다 빅데이터가 되는 것은 아니다.

빅데이터는 '3-Vs'라고 부르는 규모, 속도, 다양성 등에서 '기존에 분석하던 방식을 넘어선다'는 전제 조건이 붙는다고 김 대표는 설명했다. 즉, 빅데이터는 기존의 사람 또는 관리하던 시스템에서 관리할 수 없을 정도의 규모와 감당할 수 없는 빠른 속도 및 다양성을 종합적으로 가지고 있어야 한다는 것.

때문에 기존의 해왔던 데이터 관리 체계로는 빅데이터를 감당할 수 없어 이것을 저장하고, 처리할 수 있는 다른 공간이 필요한데, 이를 '플랫폼'이라고 부른다고 덧붙였다.

데이터 거버넌스 구축해야 하는 이유

김 대표는 "현재 서울시 뿐 아니라 어떤 행정 기관도 빅데이터를 담을 수 있는 플랫폼을 완벽히 구축한 곳이 없다"고 지적했다. 이는 "빅데이터를 분석할 환경 자체가 구축돼 있지 않아 빅데이터를 분석할 수 없는 상황을 의미한다"고 덧붙였다.

때문에, "빅데이터를 분석하기 위해선 먼저, 데이터 관리 체계인 '데이터 거버넌스'가 구축돼야 한다"고 강조했다.

남태우 성균관대 교수는 '데이터 거버넌스'는 아직 사전적인 정의가 정해진 개념이 아니라며, 관련 정의에 대해 "조직간의 데이터의 흐름을 이해하는 것"이라는 응답이 가장 높았다고 말했다.

데이터 관리 정책, 데이터 관리 기능, 데이터 관리 프로세스, 데이터 관리 조직 등을 포함, 업계나 협회, 정부 기관 등 이해관계가 설정한 기본 표준을 준수하는 것도 데이터 거버넌스에 포함된다고 덧붙였다.

김 대표는 "데이터 거버넌스 구축은 빅데이터를 분석할 수 있는 가장 기본적인 환경을 갖춰 AI로 미래를 예측할 수 있는 발판을 마련하는 것"이라고 전했다.

AI타임스 이하나 기자 22hnxa@aitimes.com

[관련기사] 부동산 공시지가·작물 생육 데이터가 궁금하다면? "전라남도 빅데이터 허브로"

[관련기사] 멸균효과, 일반 방역로봇의 30배…오미크론에 맞설 차세대 로봇 광주서 나왔다

저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지