정부가 인공지능(AI) 학습용 데이터를 'AI Hub'에 추가 개방한다. (사진=AI Hub 홈페이지 캡처)
정부가 인공지능(AI) 학습용 데이터를 'AI Hub'에 추가 개방한다. (사진=AI Hub 홈페이지 캡처)

정부가 인공지능(AI) 학습용 데이터를 'AI 허브(Hub)'에 추가 개방한다. 기존에 있던 170종에 190종을 더한다. 새로 공개할 데이터는 품질과 활용성 검증을 거쳐 순차적으로 개방할 예정이다. 이번 데이터 기획부터 구축까지 관련 산학연과 국민 모두 참여했다.

과학기술정보통신부(장관 이종호, 과기정통부)가 국내 AI 기술과 산업 발전을 위해 AI 학습용 데이터 190종(5억8000건)을 AI Hub에 12일부터 추가 개방한다고 밝혔다. 작년 공개한 '2020년 구축 데이터' 170종(4억8000건)에 더해 2021년 구축한 190종에 대한 품질·활용성 검증을 거쳐 순차적으로 개방한다. 해당 작업이 완료되면 AI 학습용 데이터 총규모는 381종에 달한다.

이번에 개방되는 6개 분야 190종에 이르는 데이터는 기획부터 구축까지 산업계, 전문가와 국민이 대거 참여해 만들었다. 주로 민간 수요를 바탕으로 분야별 산학연 전문가, 데이터 활용 기업 등이 직접 진행했다. 기획 단계에서는 주로 민간에서 대규모로 구축하기 어려운 데이터를 발굴·선정하는 방식으로 이뤄졌다.

데이터 구축 과정에는 국내 주요 AI·데이터 전문기업뿐만 아니라 대학(서울대, 카이스트 등 118개), 병원(서울대병원, 국립암센터 등 50개) 등 총 811개 기업·기관과 4만3000명에 이르는 국민이 참여했다.

데이터 품질 수준 확보를 위해서 주요 대기업(네이버, 카카오, LG, KT, 현대차 등), 스타트업(라이드플럭스, 스트라드비젼 등), 대학 및 연구기관(GIST, 부산대, ETRI, 한국자동차연구원 등)도 도왔다. 주로 데이터 활용성 검토와 추가 보완을 담당했다. 정보통신기술 표준화·인증을 수행하는 한국한국정보통신기술협회(TTA)도 전문적인 품질 검증에 나섰다.

과기정통부와 한국지능정보사회진흥원(지능정보원)은 데이터 개방 후에도 AI Hub 내 품질 의견수렴 상시창구 운영, 한국정보과학회와 연계한 데이터 품질 개선 연구 지원(7월~12월) 등 민·관 협력을 통해 데이터 품질과 활용성을 지속 관리·개선해나갈 계획이다.

다음은 이번에 개방할 AI 학습용 데이터 190종 목록과 개방 일정.

2022년 개방 인공지능 학습용 데이터 190종 목록·개방 일정. (사진=과기정통부)
2022년 개방 인공지능 학습용 데이터 190종 목록·개방 일정. (사진=과기정통부)

AI타임스 김미정 기자 kimj7521@aitimes.com

[관련 기사]과기정통부, 뇌은행 지정제도 시행 본격화

[관련 기사]"국내 기초연구 역량·인식 부족, 지원 아끼지 말아야"

관련기사
저작권자 © AI타임스 무단전재 및 재배포, AI학습 및 활용 금지