(사진=셔터스톡)
(사진=셔터스톡)

인공지능산업융합사업단(단장 김준하)이 '데이터 유통 포털'을 통해 기업과 연구소등에 제공하는 인공지능(AI) 학습용 데이터셋이 지난해 3개에서 올해는 66개로 크게 늘어난 것으로 나타났다.

AI사업단이 제공하는 데이터 유통 포털은 지난 2월까지 임시 서비스하다 3월 중순부터 정식으로 서비스를 시작했다.

AI사업단은 지난해 5월 3개에 불과하던 데이터셋이 서비스 준비과정을 거쳐 불과 1년 만에 66개로 크게 늘었고, 데이터 제공 기관도 사업단 외에 아미텍, 한국광기술원, 브레인드넷을 비롯해 총 9곳으로 늘었다고 2일 밝혔다. 

데이터셋 종류도 자동차, 에너지, 헬스케어, 문화콘텐츠, 과학기술, 농축수산, 재난안전, 국토환경, 기타 등 9개 분야로 다양해졌다.

데이터 유통 포털을 통해 제공하는 데이터셋 가운데 4개를 제외한 62개가 무료다. 이들 데이터는 공공·연구목적인 경우 사용에 제한이 없다. 다만 상업적으로 이용할 때는 데이터 제공처와 협의를 거쳐야 한다.

이 가운데 ▲CODD 데이터셋 ▲MSD데이터셋 ▲태양광 발전데이터 등이 인기가 많았다. CODD 데이터셋은 여러 차량의 라이다 데이터를 포함하는 합성 데이터셋이다. MSD데이터셋은 의료영상 분류를 위한 범용 알고리즘 식별 데이터셋이다. 이외에도 폭력상황과 관련한 AI학습용 데이터, 소재특성이론 데이터 등 다양한 자료를 갖추고 있다. 

나호정 기자 hojeong9983@aitimes.com

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지