윤기욱 라온피플 CTO는 "AI 발전을 위해선 데이터 취합과 관리가 중요하다"고 강조했다. (사진=김동원 기자)
윤기욱 라온피플 CTO는 "AI 발전을 위해선 데이터 취합과 관리가 중요하다"고 강조했다. (사진=김동원 기자)

제조업에 사용되는 인공지능(AI) 발전의 핵심도 결국 데이터라는 의견이 나왔다. 윤기욱 라온피플 최고기술책임자(CTO)는 '스마트공장·자동화사업전 2022'에서 제조업에 실질적으로 쓰일 수 있는 AI 발전을 위해선 데이터 취합과 관리가 중요하다고 밝혔다. 적은 데이터셋으로 빠른 시간 내에 AI를 구축해야 하는 프로젝트가 많은 제조 분야에서 '어떻게 데이터를 관리하느냐'가 사업 성패를 좌우할 수 있다고 강조했다.

윤기욱 CTO는 8일 전시회장에 있는 라온피플 부스에서 "제조업에 AI 기술을 사용하기 위해서는 AI 모델뿐 아니라 데이터를 준비하고 정제해 적용하는 과정이 중요하다"고 말했다. 이어 "수년간 제조 분야 AI를 연구해온 라온피플은 데이터의 중요성을 다시금 되새겨 최근 출시한 '나비(NAVI) 5.0'에 데이터 관리를 효율화하는 알고리즘을 탑재했다"고 밝혔다.

데이터는 AI를 학습시키는 핵심적인 요소다. 많은 데이터를 학습시킬수록 AI의 정확도가 높아진다. 하지만 AI 성능을 높일 수 있는 충분한 데이터를 구축하는 것은 쉽지 않다. 제조업도 마찬가지다. 공장에서 불량률을 검출하는 AI 모델을 만들 때 불량 데이터가 쉽게 모이는 라인이 있지만 불량이 간헐적으로 나타나는 라인도 있다. 제조업 특성상 조명 등의 환경 영향을 받아 힘겹게 모은 데이터를 쓸 수 없는 경우도 생긴다.

AI를 개발할 때마다 기존 데이터를 다시 정리하는 것도 일이다. 새로운 AI 모델을 개발하기 위해 기존 데이터를 다시 분류하는 작업에는 많은 시간과 비용이 발생한다. 윤기욱 CTO는 "오래된 데이터를 재활용하기 위해 매번 모든 데이터를 다시 정리하는 것은 어려운 일"이라며 "처음 데이터를 폴더에 잘 분류해 저장한다 해도 시간이 지나면 출처를 알 수 없어 활용하기가 어렵다"고 말했다.

라온피플은 나비 5.0에 데이터 관리 알고리즘을 추가했다. (사진=김동원 기자)
라온피플은 나비 5.0에 데이터 관리 알고리즘을 추가했다. (사진=김동원 기자)

라온피플은 이 문제를 줄이기 위해 최근 출시한 나비 5.0에 데이터 관리 알고리즘을 추가했다. 대표적인 기능이 반지도학습(semi-supervised learning)이다. 반지도학습은 입력값에 대한 결과값이 없는 미분류 데이터(unlabeled data)를 지도학습에 사용하는 방법이다. 분류된 데이터가 적더라도 미분류된 데이터를 활용해 데이터들의 분류와 분류 결정 경계를 만들 수 있는 장점이 있다.

윤 CTO는 "AI 학습에 있어 지도학습이 가장 좋은 것은 맞다"면서도 "하지만 최종 목표까지 AI를 학습시키는데 지도학습만으로 과정을 소화하기에는 어려움이 많다"고 말했다. 이어 "모든 데이터들을 다 레이블링해 학습하는 것은 힘들므로 반지도학습에 도움이 되는 데이터만 골라 학습을 시키게 되면 목표에 도달하는 시간을 단축할 수 있다"고 설명했다.

회사는 나비 5.0에 데이터 불균형을 해결할 수 있는 기능도 추가했다. 사용자의 기준에 맞춰 제품을 판정하고 불량 유형별로 데이터를 분류할 수 있는 '머큐리(Mercury)' 툴을 탑재했다. 이 툴은 다양한 조명과 각도로 촬영한 이미지를 한 번에 학습하고 검사한다. 한 번의 검사로 사용자가 필요로 하는 다양한 데이터를 얻을 수 있어 데이터 분류가 쉽고 불균형 문제도 해결할 수 있다.

윤 CTO는 "데이터 불균형을 극복하려면 실질적으로 필요한 데이터들을 원하는 조건에 맞춰 만들어내는 것이 가장 효율적"이라면서 "이 툴은 사용자가 원하는 양품 이미지에 제작자가 원하는 유형의 데이터를 만들어낼 수 있다"고 말했다.

라온피플이 이번에 출시한 나비 5.0은 2017년 처음 출시한 1.0 버전의 업그레이드 버전이다. 라온피플은 2017년 국내 기술로는 처음으로 산업용 AI 툴킷인 나비 1.0을 추가했다. 이후 매해 거듭하며 새로운 버전을 출시했다. 2.0은 제조산업에 특화된 기술을 추가했고 3.0은 비용 효율화, 4.0은 고객 편의성을 향상했다. 이번 5.0은 여기에 데이터 가공 시간을 줄이고 전량적 데이터를 추정할 수 있는 기능을 추가했다.

윤기욱 CTO는 "나비 5.0은 '데이터 중심의 AI 툴킷'이 핵심"이라며 "많은 기업이 AI 프로젝트를 현장에 적용하기 어려워하는데 여기서 가장 문제가 되는 데이터 준비 과정을 개선한 모델"이라고 소개했다.

AI타임스 김동원 기자 goodtuna@aitimes.com

[관련기사]라온피플, AI·메타버스 관련 300억원 규모 투자 유치...800억원 이상 자금력 확보

[관련기사]라온피플-연세의대, 'AI 융복합의료 시스템' 공동연구 착수

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지