인공지능(AI) 전문 와이즈넛(대표 강용성)은 지난 2021년부터 과학기술정보통신부 주관 '제1차 정보통신, 방송 기술개발사업' 중 정보통신기획평가원(IITP)에서 추진하는 ‘데이터 규모 확장과 정확성 향상을 위한 다크데이터 분석 기술 개발’ 과제의 주관기관으로 참여, 3차년도 개발을 완료했다고 4일 밝혔다.
이 연구는 2024년까지 4차년도로 진행한다. 그간 활용이 어려웠던 다크데이터를 유용한 데이터로 전환하는 게 주요 목표다. 6종(영상, 이미지, 오디오, 텍스트, IoT, 시스템 로그)의 다크데이터를 수집 및 분석, 유의미한 지식 데이터셋을 발굴하고 활용하는 방식이다.
인터넷 데이터센터(IDC)에 따르면 생산 및 저장되는 데이터의 약 90% 이상이 미활용 다크데이터다. 와이즈넛은 1, 2차년도에서 다크데이터로부터 의미 있는 정보를 추출하기 위한 알고리즘과 모델을 개발한 바 있다.
특히 수집 데이터를 실제 데이터 형식에 따라 자동 분류하는 기술을 구축, 비정형 데이터로부터 정형 데이터를 추출할 수 있도록 기술적 기반을 마련했다고 전했다.
3차년도 과제에서는 가치 있는 정보를 추출하는 기존의 연구내용을 고도화, 실제 다수 산업에서의 활용 방안을 탐색하기 위해 제조 산업 및 영상 컨텐츠 분야에서의 실증 방안 연구에 주력했다.
▲제조 현장에서 산업 장비 로그데이터, 센서 데이터 등 현황을 모니터링하거나 수요예측 데이터, CCTV데이터 등에서 발생하는 산업 현장의 설비 안전 상황을 파악하거나 ▲영상 콘텐츠 분야에서는 드라마 동영상이나 음성의 비정형 데이터에서 메타 정보를 추출, 장면별로 적합한 광고 아이템을 찾아내는 등 실제 지식 데이터로 활용할 수 있는 실증 연구를 진행했다.
강용성 와이즈넛 대표는 “다크데이터를 유의미하게 활용한다면 각종 AI 서비스의 정확도는 높아질 것"이라며 "빅데이터 분석 및 활용을 위한 기술적 기반을 토대로, 미래 데이터 및 AI 기술 혁신을 선도해 나갈 것”이라고 말했다
장세민 기자 semim99@aitimes.com
