과기부, AI 학습용 데이터 구축에 크라우드웍스 플랫폼 등록 작업자 15만 활용

크라우드웍스 로고
크라우드웍스 로고

인공지능(AI) 플랫폼 기업 크라우드웍스(대표 박민우)는 과학기술정보통신부가 추진하는 ‘랜드마크 이미지’와 ‘딥페이크 방지 영상’의 AI 학습용 데이터 구축 사업에 참여한다고 30일 밝혔다.

이번 AI 학습용 데이터 구축 사업은 과기정통부가 AI 통합지원 플랫폼인 AI허브를 통해 AI 개발에 필요한 데이터를 누구나 활용할 수 있는 양질의 데이터를 대규모로 구축 · 개방하는 사업이다.

’랜드마크 이미지’ AI 데이터 사업은 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 주요 랜드마크 이미지 데이터를 구축한다. 이를 통해 전국 주요 50개 도시 랜드마크 이미지 총 500만장 이상을 AI 학습용 데이터로 축적한다.

크라우드웍스는 자사가 운영하는 플랫폼에 등록된 15만명 이상의 작업자를 활용해 데이터 전처리 과정을 진행한다. 수집하고자 하는 대표적 상징물은 버스정류장, 지하철 역사 이름에 사용되는 랜드마크, 교과서 수록 건물ᆞ지형ᆞ유적ᆞ유물에 해당되는 상징물로 선정한다. 상징물 성격은 지역별 공공기관, 주요건물, 관광명소, 편의시설, 유적ᆞ유물로 특정한다.

사람의 얼굴을 악의적으로 변조한 ‘딥페이크 방지영상 AI 데이터’는 한국인 특성을 반영하는 얼굴 합성 데이터 생성을 주요 사업 내용으로 한다. 이 사업은 적대적 생성 신경망(GAN) 기반 변형 알고리즘으로 생성한 합성영상(딥페이크) 탐지 AI 기술을 개발하기 위한 학습용 합성영상 데이터로 활용하게 된다.

크라우드웍스는 자사 플랫폼에서 다양한 범주(성별, 나이, 키, 몸무게)의 참가자를 모집하고, 동시에 많은 사람이 동영상을 쉽게 올릴 수 있도록 모바일 기반의 크라우드소싱 플랫폼도 사용한다. 참여자가 크라우드웍스 모바일 앱을 사용해 제시된 시나리오에 따라 쉽고 빠르게 동영상을 스스로 촬영해 업로드할 수 있도록 지원할 예정이다.

[관련기사] IBS, 그래핀 4층 대면적 합성기술 세계 첫 개발

[관련기사] ‘안면인식’과 ‘안면코딩’ 그리고 '딥페이크'

[관련기사] "인공지능(AI)으로 딥페이크 잡아라"

키워드 관련기사
  • 크라우드웍스, AI 의료 분야 데이터 라벨링 기술 고도화 나서