크라우드웍스, 2020년 주요 서비스 지표 발표
연령대·거주지 다양하게 분포…작업량도 방대
가장 먼 곳서 활동 중인 라벨러 거주지는 '아르헨티나'

현재 활동하는 데이터 라벨러 가운데 나이가 가장 많은 사람은 93세, 최연소 라벨러는 14세인 것으로 나타났다. 사진은 지난 2018년 경기도 수원시 권선구 버드내노인복지관에서 어르신들이 컴퓨터 교육을 받고 있는 모습. (사진=뉴스1 제공).
현재 활동하는 데이터 라벨러 가운데 나이가 가장 많은 사람은 93세, 최연소 라벨러는 14세인 것으로 나타났다. 사진은 지난 2018년 경기도 수원시 권선구 버드내노인복지관에서 어르신들이 컴퓨터 교육을 받고 있는 모습. (사진=뉴스1 제공).

인공지능 학습용 데이터에 대한 필요성이 높아짐에 따라 'AI 데이터 라벨러' 수요가 날로 높아지고 있다. 코로나19로 인해 디지털 일자리에 대한 대중의 참여가 늘자, 라벨러들의 연령대도 다양해지고 있는 것으로 나타났다.

국내에서 가장 많은 '데이터 라벨러'를 보유한 인공지능(AI) 기업 크라우드웍스가 발표한 '2020년 주요 서비스 지표'에 따르면 현재 활동하는 데이터 라벨러 가운데 나이가 가장 많은 사람은 93세, 최연소 라벨러는 14세인 것으로 나타났다. 간단한 강의만으로 재택근무가 가능하기 때문에 다양한 연령층이 참여하는 것으로 분석된다. 이러한 특성때문에 참여하는 라벨러들의 거주지도 다양하다. 

크라우드웍스가 발표한 '2020년 주요 서비스 지표'. (사진=크라우드웍스 제공).
크라우드웍스가 발표한 '2020년 주요 서비스 지표'. (사진=크라우드웍스 제공).

크라우드웍스에서 활동하는 20만 명의 데이터 라벨러는 국내 뿐 아니라 아시아와 유럽 등 전 세계에 분포돼 있다. 이 가운데 가장 거리가 먼 국가에 사는 라벨러는 아르헨티나에 거주하고 있는 것으로 나타났다. 이처럼 해외에서 활동하는 라벨러들에 의해 작업된 데이터는 16만개에 달한다. 

수집·가공된 데이터 수의 양도 방대하다. 한국어 기초사전 371권 분량에 해당하는 1,856만 건의 데이터를 작업했다. 회원들이 데이터를 가공하며 발생한 일 평균 클릭 수는 약 5.3만 번에 달할 것으로 예측된다. 방대한 데이터의 품질을 고도화하기 위해 전수검사 과정을 거친다.

이때 반려되는 사례가 빈번하다. 그러나 크라우드웍스는 자체 개발한 머신러닝(ML) 기술을 활용하여, 불량작업자를 조기에 발견하고 자동으로 작업자를 관리할 수 있는 시스템을 운영하고 있다. 

크라우드웍스 박민우 대표는 “2020년은 크라우드웍스가 폭발적으로 성장하며 국내 대표 데이터 라벨링 플랫폼으로써의 입지를 다진 한 해였다”며 “올해는 국내 뿐 아니라 글로벌 AI 시장으로 진출할 발판 마련을 위해 서비스 고도화에 힘쓸 것”이라고 밝혔다. 

한편, 올해로 설립 5년차를 맞이한 크라우드웍스는 업계 최초 ‘크라우드소싱’ 방식의 인공지능(AI) 학습 데이터 플랫폼을 선보이며, 시간과 제약이 없는 양질의 일자리 창출과 솔루션 고도화에 필요한 데이터를 국내외 시장에 제공해 왔다. 

크라우드웍스가 발표한 '2020년 주요 서비스 지표'. (사진=크라우드웍스 제공).
크라우드웍스가 발표한 '2020년 주요 서비스 지표'. (사진=크라우드웍스 제공).

AI타임스 유형동 기자 yhd@aitimes.com

취재노트
최근 게임 유튜버로 수 십만명의 구독자를 확보한 90세 일본 여성이 ‘최고령 게이머’로 기네스북에 올랐다고 합니다. 해당 언론 보도를 접하며 "인생은 90세부터"라는 어르신들의 말씀이 우스갯소리가 아니구나 느꼈는데요. AI 산업 분야에서도 적용되는 것 같습니다.
키워드 관련기사
  • 크라우드웍스, ‘월드 IT쇼 2021’서 데이터 라벨링 서비스 선보인다
  • 크라우드웍스, AI 의료 분야 데이터 라벨링 기술 고도화 나서
  • 광주시, 6개월간 ‘AI 데이터 라벨러’ 330여 명 배출