머신러닝 데이터 기업 슈퍼브에이아이(대표 김현수)가 자동 데이터셋 생성 기능을 제공하는 ‘슈퍼브 큐레이트’를 정식 출시했다고 27일 밝혔다.
슈퍼브 큐레이트는 머신러닝 팀이 훈련용 데이터셋을 구축해 인공지능(AI) 모델을 구현할 수 있도록 하는 데이터 큐레이션, 즉 데이터를 취합, 선별, 분류, 구조화하는 도구다.
기존 데이터셋 구축 및 관리 방식에서 벗어나 컴퓨터 비전 데이터를 한곳에서 관리, 선별, 시각화할 수 있다는 것을 장점으로 꼽았다. 또 AI 기능을 통해 데이터셋 전체를 대변하는 균형 잡힌 학습용 데이터 슬라이스를 자동으로 구축하거나, 엣지 케이스나 라벨링 오류일 확률이 높은 데이터와 같이 중요한 데이터를 자동으로 탐색하는 등 사람의 개입을 최소화하면서도 문제를 해결해 준다고 설명했다.
핵심 기능 중 하나인 '오토 큐레이트'는 고성능 데이터 선별 알고리즘을 활용해 학습용 데이터셋이나 검증용 데이터셋에 반드시 포함시켜야 하는 유의미한 데이터를 편향성 없이 자동으로 선별, 머신러닝 모델의 정확성을 개선할 수 있도록 돕는다고 전했다. 이를 통해 균형 잡힌 데이터셋을 구축할 수 있어 랜덤 샘플링 의존도가 대폭 줄어들게 된다고 덧붙였다.
슈퍼브에이아이 측은 "데이터셋이 커지고 속성값이 다양해져도 동일한 ROI를 유지하려면 더 적은 시간, 노력, 비용으로 더 많은 데이터를 라벨링 할 수 있는 우수한 모델을 구축하고 관리할 수 있어야 한다"라며 "슈퍼브 큐레이트를 이용하면 데이터셋 관리에 대한 고민은 줄어들게 될 것”이라고 말했다.
한편 2018년 설립한 슈퍼브에이아이는 AI 개발 협업 플랫폼과 함께 MLOps 및 DataOps 분야에서도 자동화된 업무 프로세스 관리를 위한 통합 플랫폼을 제공한다.
이주영 기자 juyoung09@aitimes.com
