광주과학기술원(GIST, 총장직무대행 박래길)은 김홍국 전기전자컴퓨터공학부 교수가 지도하는 오디오지능연구실과 한화비전 AI연구소(소장 노승인) 공동 연구팀이 국제 인공지능(AI) 음향인식대회인 '디케이스(DCASE) 챌린지 2023'에서 실내 음향 이벤트 탐지 부문 1위에 올랐다고 12일 밝혔다.
디케이스 챌린지는 국제 음향 및 이벤트 탐지 분류 경진대회로 국제전기전자공학회(IEEE) 산하 신호처리소사이어티(AASP)가 2013년부터 개최하는 세계적 대회로, 인공지능(AI)을 이용해 소리를 듣고 상황을 판단하는 음향 인식 기술을 겨룬다.
GIST-한화비전팀은 실내 음향 이벤트 탐지 부문에서 단일 모델 분야 1위, 앙상블 모델 분야 2위를 달성, 연구의 우수성을 입증했다고 설먕했다.
실내 음향 이벤트 탐지 부문에서는 실내 환경에서 발생하는 진공청소기, 설거지 소리, 개 짖는 소리, 물 흐르는 소리 등 10가지 소리를 AI 기술로 탐지하고 구별하는 능력으로 순위를 매긴다.
연구팀은 다양한 오디오 지능을 구현할 수 있는 AI 기술을 접목, 성능을 대폭 높였다고 전했다. ▲AI가 추론한 의사 정답을 학습에 활용하는 준지도 학습 기술 ▲사전 학습 훈련 모델의 추론 결과를 기존 모델의 추론 결과와 융합하는 기술 ▲성능 향상을 위해 데이터를 정제하는 기술 ▲인공지능의 성능을 향상하는 여러 기법들을 병합하는 앙상블 기술을 적용했다.
이를 통하면 카메라로 볼 수 없는 상황에서도 소리만 듣고도 무슨 일인지 탐지할 수 있어, 실내 감시나 AI 스피커 등 다양한 앱에 활용할 수 있을 것으로 연구진은 기대하고 있다.
김홍국 교수는 “이번 대회를 통해 얻은 경험과 기술은 한화비전이 개발하는 CCTV에서 음향 이벤트를 탐지하는 데 적용할 예정”이라며 “나아가 소셜미디어 콘텐츠에서 음성구간 및 음향 이벤트를 검출하는 기술 등 더 효율적이고 사용자 친화적인 서비스를 개발하기 위해 노력하겠다”고 말했다.
GIST 학생들은 “한화비전 연구원들과의 토론과 김홍국 교수님의 지도 덕분에 좋은 결과를 얻을 수 있었다”며, “이번 성과에 만족하지 않고 오디오 지능에 대한 AI 모델을 꾸준히 발전시킬 수 있도록 연구에 박차를 가하겠다”고 전했다.
한편 GIST 오디오지능연구실(AiTeR)에서는 음성․음향 인식을 위한 AI 모델을 연구하고 있다. 또 음향 이벤트 탐지, 음성 합성, 음성 잡음 제거, 음성 인식, 이상 상황 감지, 생체정보 처리 등 연구를 국내외 산학연기관과 공동으로 진행하고 있다.
이번 연구는 한화비전, 과학기술정보통신부 및 정보통신기획평가원의 미디어 콘텐츠 음성 언어 현지화 기술개발 사업의 지원으로 수행했다.
나호정 기자 hojeong9983@aitimes.com
- 광주 AI영재고 예산 1000억 예상…기획용역 연내 마무리
- GIST, 모르는 데이터 구별하는 AI 기술 개발
- 광주시, 미래차 광주비전 실행방안 제시
- 광주 AI시제품·서비스 지원, 제2의 '엔서' '블루캡슐' 탄생할까
- GIST 아카데미 4월 조찬포럼 개최..."AI 시대, 예술의 정의란”
- 한승수 전 총리, GIST 방문해 산업 현안 논의
- 리버밴스, AI 에이전트 기반 '마이AI넷'으로 새 BM구축
- ‘한국형 초미세먼지' 더 정확히 예측…GIST, 대기질 예보 시스템 개발
- GIST, '교수 1인당 논문 피인용 수' 국내 1위·세계 5위 달성
- GIST 제9대 총장에 임기철 전 KISTEP원장
- GIST, ‘양자지우개’ 관측과 새로운 해석 제시
- 오디오가이, 음원분리 활용 공간음향 제작 ‘AI 360’ 론칭
- 한화비전, ‘AI 지능형 솔루션 로드쇼’ 개최…AI CCTV 기술 소개
- 한화비전, 페루에 AI 카메라 2000대 도입...남미 보안 시장 공략
