인공지능(AI) 전문 무하유(대표 신동호)는 2년 연속 ‘국회도서관 융복합서비스 데이터셋 구축 사업’의 주관사업자로 선정됐다고 25일 밝혔다.
무하유는 국회도서관에서 제공 중인 AI 의정분석 서비스 ‘아르고스’에 정책 이슈, 통계용어, 뉴스기사·법률명 매핑 데이터셋 등을 구축, 아르고스의 뉴스 분석 서비스를 지원할 예정이다.
구축 데이터셋의 종류는 ▲정책 이슈 모니터링 ▲뉴스 기사 문맥에 따른 긍·부정 반응 ▲통계 및 일반용어 ▲법률 및 이슈 연혁 ▲표·그림 등이다. 법률에 해당하는 이슈 키워드와 제개정일·의안·회의록·주요 사건 및 인물에 대한 정보는 물론, 통계 표의 제목 및 매칭 키워드 등도 포함할 계획이다.
무하유는 데이터셋 구축 전문 플랫폼인 ‘데이터 팩토리’를 운영하고 있다. 데이터 팩토리는 법학·문헌정보학·언어학·사회과학 등 인문학적 지식을 가진 인력으로 구성돼 있다. 유효한 통계 용어를 추출하거나 시의성 있는 이슈 키워드를 선정하는 등의 라벨링 작업 퀄리티가 높다고 전했다.
또 13년간 축적한 문서 데이터와 ‘빅데이터 자동화 처리 기술’을 보유하고 있어, 데이터 구축과 품질관리가 용이하고 고품질의 학습 데이터셋 구축이 가능하다.
특히, AI를 활용해 추출한 데이터를 사람이 직접 검증하고 수정할 수 있는 시스템을 추가해 학습 데이터의 품질을 보장한다고 밝혔다.
신동호 대표는 "공공부문 데이터베이스 구축 사업에 진출, 무하유만의 기술 및 인적 노하우를 적용해 성공사례를 늘려가고 있다"라며 "민간기업에서 필요로 하는 데이터셋까지 영역을 확대해 데이터셋 제작 역량으로 다양한 분야에 진출할 예정"이라고 말했다.
박수빈 기자 sbin08@aitimes.com
